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在 当今 信息 时 代 , 统 计 知识 得 到 越 来 越 多 的 应 用 ,各 种 统计 方法 层 出 不 
F. 在 统计 领域 中 ,统计 计算 技术 应 运 而 生 ,而 且 发 展 非常 迅速 。 它 一 方面 使 
得 许多 统计 方法 得 到 广泛 应 用 , 另 一 方面 使 得 有 些 难以 在 理论 上 进行 论证 的 
问题 通过 模拟 得 到 证 实 . 

2005 年 以 前 ,我 国 出 版 的 有 关 统 计 模 拟 的 著作 还 比较 少 , 一 般 只 是 在 理 
论 上 对 统计 计算 方法 进行 介绍 ,而 且 使 用 R 软件 给 出 具体 计算 程序 的 更 少 。 
然而 不 过 四 五 年 ,有 关 统 计 模 拟 和 对 R 软件 使 用 进行 介绍 的 书籍 开始 大 量 出 
版 . 而 我 们 适时 出 版 这 部 书 ,也 正 是 适应 时 代 的 需要 . 同时 ,本 书 也 是 省 级 教改 
项 目 “ 适 应 新 时 期 人 才 培 养 的 需要 ,构建 概率 统计 类 课程 体系 ”和 校 级 研究 生 
创新 工程 项 目 “ 基 于 复杂 数据 的 统计 计算 与 模拟 ”的 一 项 研究 成 果 . 提高 大 学 
生 以 及 研究 生 进行 数据 挖 据 、 建 立 统 计 模 型 的 能 力 是 本 项 目 改 革 的 重点 . 因 
此 ,本 书 在 写作 上 特别 注意 以 下 6 个 显著 的 特点 : 

(1) 统 计 计 算 方法 全 面 , 脉 络 分 明 : 分 别 介绍 了 逆 变 量 法 、 筛 选 法 条 件 期 
望 法 ,分 层 抽样 法 、 重 要 抽样 法 、EM 算法 、MCMC 法 等 . 既 考 虑 了 离散 型 随机 
变量 的 模拟 ,又 考虑 了 连续 型 随机 变量 的 模拟 ,同时 还 考虑 了 随机 过 程 的 模 
拟 . 不 仅 考虑 了 一 维 随机 变量 的 模拟 ,而且 考虑 多 维 随 机 向 量 的 模拟 . 

(2) 统 计 计算 方法 细 肤 详实 ,所 编写 的 程序 可 以 通过 跟踪 验证 其 准确 性 . 

(3) 密 切 结合 实际 问题 ,例如 经 济 中 的 期 权 策略 实施 、 维 修 问题 、 排 队 问 
题 等 . 

(4) 每 章 内 容 由 浅 人 人 深 ,浅显 易 懂 , 但 又 能 给 人 以 更 多 的 启示 . 同时 还 配 
有 若干 练习 ,帮助 读者 加 强 理解 与 巩固 相关 的 知识 . 

(5) 本 书 第 六 章 每 提出 一 个 模拟 方法 ,都 要 和 其 他 的 方法 相 比 较 , 尽 量 使 
算法 更 有 效 . 通 篇 构成 一 个 有 机 的 整体 ,读者 阅读 此 书 ,会 感到 逻辑 性 强 ,问题 
提出 的 背景 清晰 . f 

(6) 本 书 运用 R 语言 将 许多 例子 进行 了 编程 ,以 供 读者 借鉴 ,使 读者 感觉 
有 种 工具 在 手 的 感觉 ,可 以 增强 自信 心 ,克服 旦 难 心理 . 

本 书 的 内 容 和 练习 取舍 了 Sheldon M. Ross 的 Simulation 一 书 的 内 容 和 练 
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习 ,R 软件 的 介绍 借鉴 了 李 东 风 的 《统计 软件 教程 ) ,在 此 表示 衷心 的 感谢 . 本 
书 的 出 版 得 到 了 武汉 大 学 出 版 社 、 华 中 农业 大 学 教务 处 和 研究 生 处 的 大 力 支 
持 , 在 此 表示 衷心 的 感谢 ! 本 书 适合 大 、 中 专 院 校 从 事 统计 或 计算 机 方面 的 工 
作 或 学 习 的 教师 和 本 科 生 、 研 究 生 阅读 . 章节 的 安排 .内 容 的 组 织 以 及 程序 的 
编写 ,都 是 由 肖 枝 洪 和 朱 强 两 人 共同 商 梭 而 定 . 虽然 我 们 在 编写 的 过 程 中 作 了 
很 大 努力 ,力求 准确 ,但 是 由 于 水 平 有 限 ,所 著 之 书 可 能 存在 许多 错误 , 敬 请 读 
者 批评 指正 . 


编 者 
2010 年 1 月 于 狮子 出 
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预备 知识 


我们 设想 读者 已 经 具备 了 初等 概率 统计 的 基础 知识 ,因此 本 章 仅 对 初等 
概率 统计 中 介绍 得 较 少 而 在 本 书 以 后 有 关 章 节 所 需要 的 内 容 进行 介绍 . 


1.1 和 矩 母 函数 与 生成 函数 


有 时 直接 求 若 干 独立 随机 变量 和 的 分 布 很 不 方便 ,下 面 引 进 矩 母 沙 数 和 
生成 函数 来 解决 此 问题 . 矩 母 函数 和 生成 函数 在 第 六 章 介 绍 重要 抽样 法 时 也 
会 用 到 . 

定义 1.1 设 随机 变量 的 密度 函数 为 p(x) , 称 E[exp(tX)] X X HE 
FRR, EA gx(1) , REX gl), Bp 

g(t) = E[exp(tX)] = fexp(ts)p(x)dx. 

注 : 矩 母 函 数 g(1) 与 X A RRON EE — E AE R A 

X HEE: 

E[X*] =g” (0), 
式 中 , gO) HRR O) 关于 i 的 nn 阶 导 数 .车 随机 变量 六 与 Y 相 互 独立 , 则 
gx. (t) = gx(t) gy(t). 

我 们 将 一 些 常 用 分 布 的 矩 母 函数 列表 如 表 1-1. 


表 1-1 一 些 常用 分 布 的 矩 母 函 数 
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t(b — a) 








统计 模拟 及 其 RR 实现 — 





续 表 









分 布 名 称 E Bh PS 3 








1 
N(u,o2) exp( ut +) 








Camma(aw,A) 


E: y (n) 实质 上 为 Gamma( 村, 二) . 


定义 1.2 若 闭 为 离散 型 随机 变量 , 称 EC) 为 其 概率 生成 函数 , 记 为 
p(s), REIA pls). EPIX = kl =pi,k=0,1,2,…, 则 


$bx(s) = 2, pis" 


易 知 
Po = 由 x(0) 
P, = xs) |... k=1,2,.. 
注 :生成 函数 (s) 与 七 的 分 布 函数 相互 唯一 确定 . 通过 生成 函数 可 计算 
X WERNE. 例如 : 
f E[X] =¢'(1), E[X'] = 由 (1) + 由 (1). 
车 随机 变量 与 Y 相 互 独立 , 则 prls) = b,(s)0 (s). 我 们 将 一 些 常 用 分 布 
的 生成 函数 列表 如 表 1-2。 


表 1-2 一 些 常用 分 布 的 生成 函数 


p(z) = 天 (1-p) xx=0,1 


pugn 













l+(s-1l}p 


(1 +(s- 1)p)" 








-PP _ 
1 -—s(1 - p) 
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1.2 条 件 期 望 和 条 件 方差 


1. 条件 分 布 
如 果 夺 和 了 是 离散 型 随机 变量 ,上 且 PIX=x,Y = y] 为 了 和 了 的 联合 概率 
函数 , 则 可 以 计算 在 已 知 站 = x 的 条 件 下 了 的 条 件 分 布 , 即 若 了 的 边缘 概率 函 


数 px(*) > 0, 则 条 件 概率 西数 PIY=y|X=%] = PLS Cl. gn x f 


Y 是 连续 型 随机 变量 , 且 p(x,y) 为 三 和 了 的 联合 分 布 密度 函数 , 则 可 以 计算 
在 已 知 X = x 的 条 件 下 了 的 条 件 分 布 密度 函数 , 即 若 贡 的 边缘 密度 函数 
px(x) > O, 则 条 件 分 布 密度 函数 为 : 


_ p(x,y) 
p(y |x) a 


[91.1] 令 X 和 了 的 联合 密度 函数 如 下 ， 
(x) =] 7. 0=<x=<1,0=<y=<1, 
0, 否则 . 
- 1 _ 1 
试 求 P[X < |Y =+) 的 值 


解 易 知 py(y) =y+ 方 , 故 





p(“,y) _ x + y 
x = :一 一 一 一 = — 
p(x | y) O) T 
2 
所 以 ， 
, x+} 
1 1 + 1 + 3 11 
P — = — = 一 一 = = = 一 一 。 
[z < |Y s] f, sls! 3) 人 1 1580 
312 


2. 条 件数 学 期 望 

由 于 条 件数 学 期 望 在 统计 模拟 中 有 着 重要 的 地 位 ,我 们 在 此 给 出 其 定义 . 

如 果 莹 和 了 是 具有 联合 概率 函数 的 离散 随机 变量 , 则 在 给 定 X = x 的 条 件 
下 了 的 条 件 期 望 E[Y|X =x] 为 


DyPlX=x,Y=y| 
E[Y|X=2] = X yP|Y=y|X=x! = 一 





P|X =x} 
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即 , 给 定 X = x 的 条 件 下 工 的 条 件 期 望 是 以 给 定 X = x 的 条 件 下 了 取 值 y 的 条 
件 概率 为 权 的 加 权 平 均值 . l 

类 似 地 ,如 果 荆 和 Y 是 具有 联合 密度 函数 /(x,y) 的 连续 随机 变量 , 则 在 
给 定 X=x 的 条 件 下 了 的 条 件 期 望 E[Y|X=x] 为 


fr Karay 
[Kaay 


由 定义 知 E[Y| X] 为 X 的 函数 , 且 这 个 函数 在 X= x 时 取 值 为 E[Y| X = x]. 
同时 E[Y | X] 它 自身 也 是 一 个 随机 变量 . 下 述 性 质 是 非常 有 用 的 . 
命题 1.1 


E[Y|X =x] = 


E[E[Y|X]]=E[ Y]. (1.2.1) 
如 果 互 是 一 个 离散 型 随机 变量 , 则 方程 (1.2.1) 可 化 为 
E[Y] = Y E[Y|X=x]P|X= x]; 
而 如 果 世 是 一 个 具有 密度 函数 z 的 连续 型 随机 变量 , 则 方程 (1.2.1) 可 化 为 
E[ Y] = JELY |X = z]a(z)dz. 
我 们 在 和 和 了 是 离散 型 随机 变量 情形 下 给 出 命题 1.1 的 证 明 . 
证 X E[Y|X=<x]P|X=x]= X $ yP|Y=y|X=x}PÍX=x} 
= >> 22 PIX = <,Y = y| 
= $y} PIX=x,Y =y} 


=$ yP{Y=y} 


[811.2] 随机 变量 (X,Y) 的 联合 分 布 律 如 下 表 : 
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试 求 E[X | Y] 的 分 布 律 , EX 及 E(E[X | Y]). 
解 当 Y=1 时 ,有 


PIX=1|Y=1| -他 
同 理 , P|X=2|Y=1| =$,PIX=31Y=1| - 故 


3 

13 
E[X]Y=1] = iPIX =i|Y=1| = 一 . 
[X|Y=1]= DiPIX=ilY=1| = 


i= 


类 似 地 有 


3 
. . 28 
E Y=2 = = = = —. 
[X | ] 2 Pl i| Y 2} 15 


E[X|]|Y=3] = S iPix=ilY=3] sE, 


又 PIELX|Y] =E[X|Y=j]} =P|Y=jl,ji=1,2,3. W ELX | Y] 的 分 布 律 如 
F: 


. 13 28 11 
E[X|Y =j] 7 15 3 





P|E[X|Y] =E[X|Y=j]} =P{Y =j} = Z > 


13 7 28 15 11 5 _ 52 
E(E[X|Y])=— x t Ts X27 t ç A 


而 
3 
. . 8 13 6 52 
EX = 2 iPIX =i] =1 X37 t2 t+3 xE’ 
即 
52 
EX = E(E[X | Y]) =>2` 
3. 条 件 方差 


WE X =a 的 条 件 下 了 的 条 件 方差 如 下 : 
Var(Y|X)=E[(Y - E[Y| X])? | X]. 
同样 , Var( Y | X) 也 是 天 的 函数 ,上 且 这 个 函数 在 不 = x ARAA Var(Y | X = x). 化 
简 得 到 
Var(Y|X)=E[Y'| X] - (E[ Y| X])°. 
对 上 式 两 边 同时 取 期 望 得 到 : 
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E[Var(Y|X)]=E[E[Y' | X]] - E[(E[Y|X1)2] 


=E[Y] - E[ (E[Y | X]J)°]. (1.2.2) 
又 因为 E[ (ELY|X])] = E[Y] ,我 们 有 
Var(E[Y|X])=E[(E[Y|X])2] - (E[Y])°. (1.2.3) 


将 式 (1.2.2) 与 式 (1.2.3) 相 加 得 到 下 面 的 等 式 一 一 著名 的 条 件 方差 公式 : 
Var( Y) = E[Var(Y |X)] + Var( E[Y |X]). 

【 例 1.3】 从 某 大 学 中 任意 挑选 一 个 学 院 ,然后 从 此 学 院 任 意 挑 选 n 个 
FE. 令 工 表示 这 些 学 生 中 来 自 武 汉 市 的 人 数 . S Q 表示 该 学 院 来 自 于 武汉 
市 人 数 所 占 的 比例 ,因为 学 院 之 间 比 例 不 同 ,所 以 Q 也 为 随机 变量 . 给 定 
Q =q, M) X ~B(n,g), 从 而 , E[X|Q =q] =nq,Var(X| Q =q)=nq(1 - g). 
假设 随机 变量 Q ~ U(0,1), 上述 方式 建立 的 模型 称 为 分 层 模 型 , 记 为 

Q ~ U(0,1), 
X|Q =q ~ B(n,q). 
则 
E[X] = EELX|Q] = E[nQ] =— 


Var(X)= E[Var(X|Q)] + Var(E[X|0]) 


= E[nQ(1 - Q)] + Var(nQ) = + 


1.3 随机 过 程 简介 


以 前 我 们 学 过 的 概率 统计 中 随机 变量 序列 基本 上 是 独立 同 分 布 的 . 本 书 
中 还 将 考虑 相依 的 随机 变量 序列 . 例如 ,日 气温 将 形成 以 时 间 为 序 的 随机 变量 
序列 ,而 且 一 天 的 气温 明显 地 与 前 一 天 的 气温 不 是 独立 的 . 

随机 过 程 [X,t e T) 是 一 个 随机 变量 集合 ,状态 空间 5 是 随机 变量 X, 取 
值 的 集合 ,集合 了 称 为 指标 集 ,指标 集 可 以 是 离散 的 ,例如 7 = {0,1,2,…,| ， 
也 可 以 是 连续 的 ,例如 7 = [0,m ), 这 取决 于 应 用 的 需要 . 对 于 指标 集 7 为 离 
散 情形 时 的 随机 过 程 有 时 也 称 为 随机 变量 序列 . 

【 例 1.4】 (RARER) 令 状态 集 S= | 晴 , 多 云 | ,指标 集 了 = O, 
1,…| ,一 个 典型 的 序列 为 
将 上 述 序列 用 X, 依 次 记录 下 来 , 则 {X,t e T| 就 是 一 个 具有 离散 的 状态 空间 
S 和 离散 的 指标 集 7 的 随机 过 程 . 
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下 面 ,我 们 将 讨论 一 类 常用 的 随机 过 程 . 
1. Poisson 过 程 
假设 事件 在 [0,t] 上 任意 时 刻 发 生 且 令 NO) 表示 在 时 间 [0,:] 上 事件 
发 生 的 个 数 . 如 果 
(1) N(0)=0; 
(2) N(:) 是 独立 增 量 过 程 , 即 任 取 0 <, <: < … < L, 
NC) NC) = N(t,) ,ee NC) - N(tz,.,) 


. 相互 独立 ; 


` 


(3) 对 任何 上 > 0,s > 0, J8Ë# N(s + t) - N(s) 服从 参数 为 At 的 Poisson 
分 布 , 即 i 


PIN(s +t) - N(s) = k] sanie, 


则 称 这 些 事件 构成 一 个 具有 速率 A(A > 0) 的 Poisson 过 程 . 

条 件 (1) 描 述 了 过 程 开始 于 时 刻 0. 条 件 (2) ,这 个 独立 增 量 假设 阐述 了 
到 时 刻 :发 生 的 事件 数 ( N(1) ) 与 在 时 刻 ! 和 + +s 之 间 发 生 的 事件 数 ( Ni + 
s) - NG) ) 相 互 独立 .条 件 (3) ,这 个 平稳 增 量 假设 阐述 了 NG +s) - N(t) 的 
概率 分 布 对 任何 :都 是 相同 的 . 

对 于 一 个 Poisson 过 程 , 令 X, 表示 第 一 个 事件 来 到 的 时 刻 . 进而 对 n > 1, 
£ X, 表示 第 n - 1 个 事件 和 第 ”个 事件 之 间 的 间隔 时 间 . 序列 1X,,n = 1, 
2,…| 称 为 间隔 时 间 序 列 . bn an X, = 1, = 4, 则 Poisson 过 程 的 第 一 个 
事件 将 发 生 在 时 刻 1 和 第 二 个 事件 将 发 生 在 时 刻 4 之 间 ( 如 图 1-1). 


2 3 -Dt t 
图 1-1 间隔 时 间 
现在 我 们 来 确定 X. 的 分 布 . 首先 注意 到 事件 |X, > | 发生 当 且 仅 当 


Poisson 过 程 在 区 间 [0,:] 上 没有 一 个 事件 发 生 ,从 而 
PIX > t] =P|N(t)= 0] =e 


因此 X 是 均值 为 一 的 指数 分 布 . 为 了 获得 X, 的 分 布 ,注意 到 


P|X, >1t|X, =s|=P|#E(s,s + t] 上 没有 事件 发 生 |X,， = s! 
= Pl 在 (s,s + 1] 上 没有 事件 发 生 | 
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其 中 最 后 的 两 个 方程 成 立 是 因为 独立 增 量 性 . 由 前 述 讨论 知 , X, 也 是 均值 为 
1 的 指数 随机 变量 ,进而 X, 入 ,相互 独立. 重复 这 样 的 讨论 ,我 们 得 到 命题 
1.2. 

命题 1.2 WX, X, 为 Poisson 过 程 中 事件 发 生 的 间隔 时 间 序 列 , 则 
X, ,X,,… 是 独立 同 分 布 的 随机 变量 序列 , 且 共 同 分 布 为 具有 参数 A 的 指数 分 
hi. l 

+ s. = Y. X, 表示 第 "个 事件 发 生 的 时 刻 . 根据 事实 : S, KAF: 当 且 仅 
当 到 时 间 + BL E pf n 个 事件 发 生 ,我 们 看 到 

PIS, <t} = P|NG:) >n} = y a SD. 


PD 


易 知 上 式 左边 是 S, 的 分 布 函数 . 对 它 进行 微分 得 到 S, 的 密度 函数 p,(t) 如 
F: 


p,(t)= 之 je a2 _ Zaer G 





So a (At)! S au (At) 
= 之 局 = Di -Ze A 


(At)! 
(n—- 1)! 


定理 1.1 WING), > 0] 是 参数 为 A 的 Poisson 过 程 , 则 在 给 定 N(i)= n 
的 条 件 下 ,事件 的 到 达 时 刻 (S, ,5,,… S.) 的 联合 分 布 密度 为 


! 
Fsi sss ING) =n) =>, 0 <s, < s, Le < s, € t. 


= Ae 


(1.3.17 
证 明 AENG) =n, 设 m 个 事件 的 到 达 时 刻 分 别 为 (3, ,3S，…，,3.). 对 
充分 小 的 增 量 As,,i=1,2,…,n, 事件 N(t) =n 和 在 [s,s; +As),i=1,2,.…， 
n 中 恰 发 生 一 起 事件 而 在 [0,51), [si + Asis), [s.a + Ass155a) ,Ls, + 
As, ,t] 中 没有 事件 发 生 等 价 . 
flsiss2s° s, | N(t) = n) As, As: As, 
=P|s =€ S, < s; + As;,,i=1,2,;p n,n |N(t) =n] + olAs,Asz As, ) 
Pls <€ S, < s; + Asi = 1,2,-. n. N(t) = n} 

+ o(AsiAsa As), (1.3.2) 
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Pls S S, < s+As,i=1,2,..,n,N(t)=n| 

=P|N(s, + Às,) - N(s,)=1,i=1,2,.…,n 
N(s1)=0,N(s,) -NO + Asi)=0,.…, 
N(s,) — N(s,., + As...) =0,N(t) -Ne + As.) = 01 
=AAs e MM... As. e An 。 


~Asl e762 TAs) ... e —A{sn-sn_1-Asn.1) e74 aAa) 


» 


e 
+ o(AsiAs,…As,) 
=A "AsiAs pv4se… + ol As As As, ). (1.3.3) 
将 (1.3.3) 代 入 (1.3.2), 然 后 除 以 ol(AsiAs,…As,) 并 取 极 限 就 得 到 (1. 3. 
1). 
注 : 式 (1.3.1) 为 nn 个 (0,t) 上 的 均匀 随机 变量 的 次 序 统计 量 的 密度 函 
数 .另外 ,定理 1.1 将 是 模拟 Poisson 过 程 的 理论 依据 . 
定义 1.3 如 果 一 个 随机 变量 有 如 下 的 概率 密度 函数 : 


_ -At (At)! 
KO) = aeh AD 


就 称 之 为 具有 参数 (n, A) 的 Gamma 随机 变量 , 记 为 Gamma (n,A) T(n, ` 
À). 

从 而 我 们 看 到 S, 一 -具有 速率 A 的 Poisson 过 程 的 第 n 个 事件 发 生 的 时 
刻 ,是 一 个 具有 参数 (n,A) 的 T 随机 变量 . 由 命题 1.2 立即 得 到 下 述 推论 . 

推论 1.1 nn 个 独立 同 分 布 的 指数 (参数 为 A ) 随 机 变量 的 和 是 参数 为 
(n,à) 的 Gamma 随机 变量 . 

【 例 1.5】 顾客 依 Poisson 过 程 到 达 某 商店 ,速率 为 A = 4 人 /小 时 .已 知 
商店 上 午 9:00 开门 . 试 求 : 到 9:30 时 仅 到 一 位 顾客 ,而 到 11:30 时 总 计 已 到 
达 5 位 顾客 的 概率 . 

B 设 i=0 表 示 上 午 9:00,N(t) 表示 [0,t] 内 商店 到 达 顾 客 数 , 依 题 意 
所 求 的 概率 为 f 

P|N(0.5)- N(0) = 1,N(2.5) - N(0.5) = 4] 
= PIN(0.5) - N(0) = 1] PIN(2.5) - N(0.5) = 4] 


(4 x0.5)'e ”ss (4 x 2)%*e *”2 
= ——— X —— ———nor f —-K- 
1! 41! 


= 0. 0155. 

2. 非 齐 次 Poisson 过 程 
齐 次 Poisson 过 程 的 假设 要 求 在 等 长 度 的 区 间 上 发 生 的 事件 具有 等 可 能 
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t > 0, 
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EE. 而 在 实际 生活 中 ,有 些 事件 的 发 生 可 能 性 是 与 时 间 相 关 的 . 例如 , 某 个 餐馆 
在 进餐 时 间 来 就 餐 的 客人 就 多 些 ,而 在 其 他 时 间 来 进餐 的 客人 就 少 些 . 如 果 用 
上 一 节 的 Poisson 过 程 来 刻画 这 个 餐馆 一 天 的 客流 量 就 不 太 合适 ,就 要 放宽 假 
设 条 件 ,用 所 谓 非 齐 次 的 或 者 非 平 稳 的 Poisson 过 程 来 刻画 . 
. 假设 事件 随机 发 生 且 N(:) 表示 到 时 间 1 时 事件 发 生 的 个 数 , 且 有 
(1) N(0)=0; 
(2) N(t) 是 独立 增 量 过程 , 即 任 取 0 < <, < < t., 
NCE) NGC) = Ni), U NCE) - N(r,.,) 

相互 独立 ; 

(3) 对 任何 上 > 0,s 宇 0, 增 量 N(s +t) - N(s) 服从 参数 为 A(1) W Poisson 
分 布 , 即 


-A(2) 


PiN(s +t) -N(s)=k} TIONI 


kd 


MU NCG), 2 01 构成 了 一 个 具有 强度 函数 为 A(1) > 0 非 齐 次 的 Poisson 过 
程 . 我 们 称 函 数 


m(t) = f A(s)ds, t> 0 


为 均值 函数 . 

强度 函数 A(t) 形象 地 刻画 了 在 时 刻 :一 个 事件 发 生 的 可 能 性 的 大 小 . 注 
BA AG) = Ai 时 , 非 齐 次 过 程 就 成 为 通常 的 时 齐 Poisson 过 程 . 

【 例 1.6】 (记录 值 ) 设 X,,n = 1,2,… 是 一 串 独 立 同 分 布 的 随机 变量 序 
列 , 且 分 布 为 F(:), BEH SO). 当 X, 代表 某 一 元 件 的 寿命 时 , A(:) = 


I f 常 定义 大 失效 率 . 它 的 直观 意义 为 : A0) 近似 地 等 于 PiX, stl X t, 


即 元 件 在 时 刻 t 仍 在 工作 ,而 在 i 的 下 一 瞬间 失效 的 条 件 概率 密度 . 
TX, =0, 3 X, > max|X,X,,… Xna) 时 ,也 就 是 当 马 .的 值 超过 以 前 任 
何 记录 时 , 称 在 时 刻 n ATER, X, 则 称 为 所 创 的 记录 值 .以 W(5 记 小 于 或 
等 于 t 的 记录 值 的 个 数 , 则 随机 过 程 {N(1) ,= 01 是 非 齐 次 的 Poisson 过 程 ， 
其 强度 函数 正好 是 失效 率 和 A(t). 例如 ， 
PIN(t) = 0] = PIX, > t| 
=1 - FP(t) = exp(In(1 - F(t))) 


, 1 二 人] = exp( - ， 265) 











= exp[ 一 


(f Co ‘exp( - f ACu)du) 
= k! | 
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【 例 1.7】 假设 事件 按照 一 个 速率 为 A 的 Poisson 过 程 发 生 而 且 独 立 于 
任何 一 个 以 前 到 来 的 事件 ,又 假设 在 时 刻 :发 生 的 一 个 事件 以 概率 p) 被 计 
数 , 则 被 计数 的 事件 的 过 程 构成 了 一 个 强度 函数 为 A(1) = Ap(1) 的 非 齐 次 的 
Poisson 过 程 . 


1.4 Markov $£ 


由 于 Markov 链 在 Bayes 统计 推断 的 模拟 中 起 到 很 重要 的 作用 ,所 以 本 节 
对 Markov 链 作 一 些 介 绍 . 

独立 随机 试验 模型 最 直接 的 推广 就 是 Markov 链 模 型 , 因 早 在 1906 年 对 
它 进行 研究 的 俄国 数学 家 Markov 而 得 名 . 以 后 Kolmogorov, Feller 和 Doob 等 
数学 家 发 展 了 这 一 理论 . 粗略 而 言 ,一 个 随机 过 程 如 果 给 定 了 当前 时 刻 :的 值 
X,, 未 来 时 刻 X,(s > t) 的 值 不 受过 去 值 X,(w < 1) 的 影响 , 则 称 之 为 具有 
Markov 性 . 当 指 标 集 T 是 非 负 整数 集 时 ,过 程 称 为 离散 时 间 Markov 链 ;而 当 指 
标 集 7 是 区 间 时 ,过 程 称 为 连续 时 间 Markov 链 ; 进 一 步 , 若 状态 空间 也 是 连续 
的 , 则 是 Markov 过 程 . 

定义 1.4 如 果 对 任何 一 列 状态 iwissi i 以 及 对 任何 时 刻 n > 0， 
若 随机 过 程 IX n = 0,1,2,…| 满足 Markov HE: 
PIX, Sj |X =io Ky = Ko =i. X, =il = PIX,,, =j|X, =i), 
则 称 随 机 过 程 [Xn = 0,1,2,…} 为 离散 时 间 的 Markov 链 , 称 PiX,,, = ;| X, = il 
为 Markov 链 的 一 步 转移 概率 . 记 为 P. 

进一步 ,如 果 条 件 概率 PX, =j|X, =i) 与 时 刻 无关, 则 称 该 Markov 
链 有 平稳 转移 概率 , 记 为 P;。 有 时 称 具 有 平稳 转移 概率 的 Markov 链 为 时 间 齐 
fE (homogenized) 的 Markov 链 ,或 简称 为 时 齐 的 Markov 链 . 

易 知 ,对 任意 的 i,j > 0， 


P,>0 H > P, = 1. 
为 方便 起 见 ,我 们 可 以 将 一 步 转 移 概 率 用 矩阵 表达 出 : 


Po Po Po 
Pio Pi Po 
P = . : . 
Po Pa Pa 


[81.8] (直线 上 的 随机 游 动 ) 考 虑 在 直线 的 整数 点 上 运动 的 粒子 . 当 
11 
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它 处 于 位 置 j 时 ,向 右 移 动 到 j + 1 的 概率 为 p, 而 向 左 移动 到 j - 1 的 概率 为 
q = 1 - p. 假定 时 刻 0 时 粒子 处 于 原点 , 即 X, = 0, 于 是 粒子 在 时 刻 n 所 处 的 
位 置 X, 就 是 一 个 时 齐 的 Markov 链 . 其 转移 概率 为 
ps,k=j+1, 
Pa =tq,k=j-1, 
0,k 取 其 他 值 . 
当 p = q = 0. 5 时 ,就 是 简单 的 对 称 随机 游 动 . 它 可 以 用 于 公平 赌博 模型 中 . 如 


果 甲 有 赌资 41， 乙 有 周 资 4，, 则 可 以 证 明 乙 先 输 光 的 概率 为 一 和 一 说 明 同 


资 越 多 越 容易 取得 最 后 的 胜利 . 它 在 统计 学 的 序 贯 分 析 中 也 很 有 用 . 
一 个 时 齐 的 Markov 链 可 由 它 的 初始 状态 X, 的 概率 分 布 以 及 转移 概率 矩 
阵 完全 确定 . 记 PIX, =i} =p. 238 
PIX = iX =i ,i 
=P|X, =i, X, =}, =i, X. = L. | 
-PIX =i |X, =i, =i ,X, =i," X, = ü] 





=P|X, =i |P a Pag Pai 

在 Markov 链 的 分 析 中 ,人 们 所 关心 的 是 过 程 可 能 实现 的 概率 有 多 大 . 也 
就 是 ,在 时 刻 m 时 , 它 处 于 状态 i, 那么 经 过 时 间 后 它 处 于 状态 7 的 概率 有 多 
K? ip PIX... =j|X, = 计 = Pi? ,我 们 得 到 步 转 移 矩 阵 

p™® = (P) . 
易 知 
P P x P x -..- x P = P". 

【 例 1.9】 (排队 问题 ) 顾客 到 服务 台 排 队 等 候 服务 . 在 每 一 服务 周期 中 
只 要 台 前 有 顾客 在 等 待 ,就 要 对 排 在 队 前 的 一 位 顾客 提供 服务 . 当然 ,如 果 服 
务 台 前 是 空 的 ,就 不 可 能 实施 服务 . 设 在 第 ”个 服务 周期 ( 指 对 第 n 个 顾客 的 
服务 ) 中 到 达 的 顾客 数 为 一 随机 变量 Y , 其 分 布 为 


PY, =k} = Pis k=0,1,.…, Xe. = 1, 
k=0 


并 且 Y, 是 相互 独立 的 . 记 X, 是 在 第 n 个 服务 周期 开始 时 服务 台 前 排队 的 顾 
客 数 , 则 显然 有 

X -1+Y, X z1, 
o 

了 ， X, =0, 
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MUJ X, 为 Markov 链 , 其 转移 概率 矩阵 为 

P Pi Ph D Ps 
Po P h Ps P 
0 p Pi P Pa 


0 0 po P h 
0 0 0 po p 


这 是 因为 
PiX „a =k|X =0} =P[Y =k] =p,, k=0,1,. 
PIX, =k|X =1} =P[|Y =k} =p,, k=0,1,--- 
PIXZ =0|X, =2] = 0, 
P|X,, =1|X, =2] =P|Y, = 0] =p 
如 果 对 某 一 时 刻 n > 0, 8 P > 0, 则 称 状态 i 可 以 到 达 状 态 j (accessible) , 
记 为 i 一 j. 它 表示 从 状态 i 经 有 限 步 可 以 到 达 状 态 j. 如 果 从 状态 i 经 有 限 步 
可 以 到 达 状 态 j, 反之 亦 然 , 则 称 状态 i 和 状态 j 是 互通 (communicative) 的 , 记 
$ iej. 
如 果 Markov 链 的 所 有 状态 互通 , 则 称 此 Markov 链 是 不 可 约 (irreducible) 
的 . 
设 i Hy Markov 链 的 一 个 状态 EPP > 0 的 所 有 正 整 数 n(n > 1) 的 最 大 
公约 数 , 称 为 状态 i 的 周期 (period). 记 为 d(i). 如 果 d(i) = 1, 称 状态 i 为 非 
周期 的 . 
如 果 对 所 有 正 整数 n(n > 1) 都 有 Ps”= 0, RRE i 的 周期 为 . 
【 例 1.10】 考虑 只 有 0,1 两 个 状态 的 随机 过 程 {1X,,n > 0], 转移 概率 
矩阵 为 
l-a x 
P -| B 1 “a l 
H a=1 -BB 时 , 易 验 证 X, 为 独立 同 分 布 的 随机 变量 , 且 
PIX,=0} =8, PIX, =1]| =1 -8. 
X a #1 - B BF , P RWE X, 28 Markov 链 . 
问题 : 当 经 过 长 时 间 转 移 后 , X, 处 于 状态 0 的 概率 为 多 大 ? 
HAR: T, = infla P|X =-0|X,= ill, # T, AREO 00388. 其 分 布 
为 
PlT =1|X%,=0} =P|X =0|X%,=0}] =1 -a =f”; 
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PIT,=2|X, =0] =P|X, =0,X. =1|X, =0| 
=P|X, <0|X, =1]PIÍX, =1|X, =0| 
= ag = fo ; 
P|T,=3|]X, =0] =P|X, =0,X, =1,X, =1| X, = 0| 
=P{X, =0|X, s=1|PIX, =1|X =1|PIX =1|X,=0| 











=aß(1 - 0) = fo. 
由 归纳 法 知 ， 
PlT, =n|X, =0} =apB(1l - pB)"” = fo”. 
记 
B a a -a 
4=(6 HE s=[ ° ME 
则 
p=—1 4+1-a-8P， 
we + 8 a+p 
且 易 知 
p- (1 -a - 8) 
a 十 a+pB 
进而 
B a 
Hap eB A tl gE B yga ota e 
a+B a+B 


这 告诉 我 们 ,不 论 初始 状态 是 什么 ,在 经 过 相当 长 的 一 段 时 间 以 后 ,过程 会 以 




















lim Po ias = P s B'a e) 
为 此 Markov RFR, A (rm). 
一 般 而 言 , 如 果 某 个 Markov 链 的 状态 是 有 限 的 ,不 可 约 的 且 非 周期 的 , 则 
它 一 定 存在 平稳 分 布 ,将 其 平稳 分 布 记 为 m = (mom, rm). 一 般 根据 下 
述 方法 比较 容易 计算 zr. 


m=nP, H Y mi = 1. 


# mP = mP 则 称 此 Markov 链 为 可 遂 的 . nf 386 Markov 链 在 8. 2 节 的 
MCMC 方 法 中 有 重要 的 作用 . 易 验 证 例 1. 10 4a Markov 链 . 
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练 习 1 


1. 若 也 是 一 个 参数 为 (n,A) 的 Gamma 随机 变量 , 试 计算 随机 变量 的 
期 望 ELX] 和 方差 Var(X). 

2. 一 个 装 有 4 个 白 球 和 6 个 黑 球 的 铅 子 . 选择 一 个 容量 为 4 的 随机 样本 ， 
令 了 表示 在 这 个 样本 中 的 白 球 数 . 现 从 继 子 中 剩 下 的 6 个 球 中 选取 一 个 . 令 

r= {1 若 此 球 为 白 球 ， 
0， 否则 . 

计算 

(1) E[Y|X=2]; 

(2)E[X|Y=1]; 

(3) Var( Y| X =0) ; 

(4) Var(X |Y=1); 

3. 4n X Tl Y E A A LER EEA SE X + Y =: 的 条 
件 下 , 互 的 条 件 分 布 为 (0,b 上 的 均匀 分 布 . 

4. 考虑 一 个 Poisson 过 程 ,其 事件 发 生 的 速率 为 每 小 时 0.3 , 则 在 上 午 10 
点 到 下 午 2 点 之 间 没 有 一 个 事件 发 生 的 概率 为 多 少 ? 

5. 对 一 个 速率 为 A 的 Poisson 过 程 , 当 s < 上 时 ,计算 PIN(s)=k|N(t) = 
n}. 

6. X} s >t, 再 做 题 5. 

7. Ẹ mj = 1,2,…,N 表示 一 个 Markov 链 的 平稳 概率 .证 明 如 果 
P|X, =j} =m, j=1,2,,N, MI 

PIX =j} =m, 对 所 有 的 n,j 

8. S 0 是 一 个 对 称 的 转移 概率 矩阵 ,也 就 是 ,对 所 有 的 i,j, q. = qa 考虑 

一 个 Markov 链 , 当 当前 状态 是 i 时 ,产生 一 一 个 随机 变量 的 值 使 得 P|X =j} = 


q, WR X =j, 则 此 Markov 链 或 者 以 概率 和 万 进入 到 状态 j, 否则 停留 在 状 


态 其 中 5,j=1,2,…,N 是 确定 的 正 数 . Em Markov 链 是 时 间 可 逆 的 并 有 具 
有 极限 概率 z = C6),j = 1,2,…,N. 
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本 书 的 宗旨 是 对 如 何 实现 统计 模拟 的 内 容 进行 介绍 ,而 统计 模拟 的 实现 
必须 借助 随机 数 这 个 强 有 力 的 工具 ,以 及 相应 的 算法 . 目前 国际 上 流行 的 一 种 
软件 一 一 R 软件 ,特别 适合 于 做 统计 模拟 ,所 以 我 们 选择 这 个 软件 来 实现 统计 
模拟 的 算法 . f 

R 软件 作为 一 个 计划 (project) ,最 早 (1995 ) 由 Auckland 大 学 统计 系 的 
Robert Gentleman 和 Ross Ihaka 开始 编制 ,目前 由 RR 核心 开发 小 组 (R Develop- 
ment Core Team) 维护 . 小 组 成 员 完 全 自愿 工作 ,努力 负责 ,并 将 全 球 优秀 的 统 
计 应 用 软件 打包 提供 给 用 户 . 用 户 可 以 通过 R 计划 的 网 站 (http :ywww. r-pro- 
ject. org) 了解 有 关 R 的 最 新 信息 和 使 用 说 明 ,得 到 最 新 版 本 的 R 软件 和 基于 
R 的 应 用 统计 软件 包 . 

R 软件 由 一 组 数据 操作 、 计 算 和 图 形 展示 的 工具 构成 ,相对 于 其 他 同类 软 
件 , 其 特色 在 于 : 

(1) 有 效 的 数据 处 理 和 保存 机 制 ; 

(2) 完 整 的 数组 和 和 矩阵 计算 操作 符 ; 

(3) 连 贯 而 又 完整 的 数据 分 析 工 具 ; 

(4) 图 形 工具 可 以 对 数据 直接 进行 分 析 和 展示 ,同时 可 用 于 多 种 图 形 设 
£; 

(5) 它 是 一 种 相当 完善 .间接 而 又 高 效 的 程序 设计 语言 (也 就 是 “S”) , 它 
包括 条 件 语句 循环 语句 、 用 户 定义 的 递归 函数 以 及 各 种 输入 输出 接口 . 

R 是 一 个 非常 好 的 开发 新 的 交互 式 数据 分 析 方 法 的 工具 , 它 的 开发 周期 
短 , 有 大 量 的 扩展 包 (package) 可 以 使 用 . R 有 强大 的 统计 功能 ,大 多 数 经 典 的 
统计 方法 和 最 新 的 技术 都 可 以 在 R 中 直接 得 到 . 

R 是 自由 软件 ,不 向 使 用 者 收取 任何 费用 . 它 是 彻底 地 面向 对 象 的 编程 语 
言 , 和 Matlab 很 相像 . 用 户 要 安装 时 ,可 以 进入 http: ZZeran. r-project. org, 下 载 
“ Download and Install R”" 栏 中 的 软件 ,点 击 “Windows” ,进入 base, F 28“ Down- 
load R xxxx for Windows” (如 Download R 2.9.1 for Windows, H 前 最 新 版 本 为 
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R 2.10.1) ,然后 按 提示 安装 即 可 . 
2.1 R 软 件 基本 操作 


R 系统 的 基本 界面 是 一 个 交互 式 命令 窗口 ,命令 提示 符 是 一 个 大 于 号 , 即 
“>”. 命 令 运行 的 结果 马上 显示 在 命令 下 面 . R 命令 有 两 种 形式 :表达 式 和 赋 
值 运算 (用 “< -” 或 “=” 表 示 赋 值 运 算 符 ). 在 命令 提示 符 后 键 人 一 个 表达 
式 表示 计算 此 表达 式 并 显示 结果 . 例如 : 

>3 * *2+sqrt(4) 
[1]11 

几 值 运算 把 赋值 号 右边 的 值 计 算出 来 并 赋 给 左边 的 变量 . 
>x1<-0:10;x1 # 如 果 一 条 语句 后 继续 写 语句 ,需要 用 “;” 隔 开 . 
[1] 012345678910 

符号 # 表 示 此 符号 以 后 的 这 行 语句 是 注释 语句 ,R 软件 是 不 会 执行 的 。 

可 以 用 向 上 光标 键 来 找 回 以 前 运行 的 命令 ,再 次 运行 或 修改 后 再 运行 . R 
是 区 分 大 小 写 的 ,所 以 x 和 X 表示 不 同 的 变量 . 

我 们 给 出 如 下 语句 来 绘制 余弦 曲线 (图 2-1). 

>xl=0:100;xl # 如 果 不 需 要 显示 xl 的 值 ,可 以 去 掉 “x1” 语 名 

>x2<-—x1 * 2 * pi/100 ;x2 

>y=cos(x2);y 

>plot(xl,y,type='1) 





0 20 40 60 80 100 
x1 


图 2-1 REAR 


上 述 语 名 中 ,0:100 表示 一 个 从 0 ~ 100 的 等 差 数 列 向 量 . 从 第 二 个 语句 
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可 以 看 出 ,可 以 对 向 量 直 接 进行 四 则 运算 . 从 第 三 个 语句 可 以 看 到 ,函数 可 以 

输入 向 量 , 并 输出 向 量 . 从 最 后 一 个 语句 可 以 看 出 ,函数 的 调用 也 很 自由 . 再 看 

一 个 例子 : | 
>vect<-c(10,6,4,7,8) 

>mean( vect) 

[1]7 

>sd( vect) 

[1 ]2. 236066 

>min( vect) 

[1]4 

>median( vect) 

[1]7 

>max( vect) 

[1]10 

>boxplot( vect) 

第 一 个 语句 输入 若干 数据 到 一 个 向 量 ,函数 c( ) 用 来 把 数据 组 合 为 一 个 
向 量 . 后 面 用 了 几 个 函数 来 计算 数据 的 均值 .标准 差 . 中 位 数 、 最 小 值 以 及 最 大 
值 .最 后 的 函数 绘制 数据 的 盒 形 图 . 

R 也 提供 了 一 般 的 计算 功能 . 例如 , 求 一 个 矩阵 的 逆 : 

>A=matrix(c(1,2,7,3),ncol=2,byrow=T);A 

>Ai=solve( A);Ai 

还 可 以 进行 矩阵 运算 ,如 

>b<-c(2,3) 

>x=Ai% * % b 

>x 

这 实际 上 是 求解 了 一 个 线性 方程 组 .“% = % ”表示 和 矩阵 的 乘法 . 

可 以 把 若干 行 命令 保存 在 一 个 文本 文件 (比如 D:\\simR\\R090806. r) 
中 ,然后 用 source 函数 来 运行 整个 文件 . 

>source( “ D ; \ \simR NNR090806. r” ) 


要 退出 R, 可 以 用 q( ) 函数 ,也 可 以 用 窗口 上 国 | R 在 退出 时 会 提示 是 否 
保存 当前 工作 空间 , 它 可 以 把 当前 定义 的 所 有 对 和 象 ( 有 名 字 的 向 量 、 和 矩阵 、 列 
表 、 函 数 等 ) 保存 到 一 个 文件 中 . 
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2.2 R 向量 


R 是 基于 对 象 的 语言 ,不 过 其 最 基本 的 数据 还 是 预先 定义 好 的 数据 类 型 ， 
如 向 量 , 和 矩阵 、 列 表 等 . 更 复杂 的 数据 用 对 象 表示 ,比如 ,数据 框 对 象 .时 间 序 列 
对 象 、 模 型 对 象 、 图 形 对 象 等 . 
R 语言 表达 式 可 以 使 用 常量 和 变量 . 变量 名 的 规则 是 :由 字母 .数字 和 名 
点 组 成 ,第 一 个 字符 必须 是 字母 或 句点 ,长度 没 有 限制 ,区 分 大 小 写 . 特别 注意 
句点 可 以 作为 名 字 的 合法 成 分 ,而 在 其 他 面向 对 象 语言 中 句点 经 常用 来 分 隔 
对 象 与 成 员 名 . 
1. 常量 
常量 笼统 地 分 为 逻辑 型 数值 型 和 字符 型 三 种 . 实际 上 数值 型 数据 又 可 分 
为 整 型 . 单 精度 、 双 精度 等 . 除非 特殊 需要 ,否则 不 必 太 关心 其 具体 类 型 . 例如 ， 
123 ,123.45 ,1.2345e30 是 数值 型 常量 ,“Weight”、“ 李 明 ” 是 字符 型 (用 双 引 号 
或 单 引 号 包围 ). 逻辑 真 值 写 为 TRUE (注意 区 分 大 小 写 , 写 为 true 没有 意义 ) ， 
逻辑 假 值 写 为 FALSE. 复数 常量 如 2.1-3.5i 这 样 表示 。 
R 中 的 数据 可 以 取 缺 失 值 ,用 NA 表示 缺失 值 . 函数 is. na(x) 返 回 x 是 否 
缺失 值 . 
2. 向 量 与 赋值 
向 量 (vector) 是 具有 相同 基本 类 型 的 元 素 序列 ,大 体 相当 于 其 他 语言 
的 一 维 数组 . 在 R 中 标量 也 被 看 做 一 维 的 向 量 . 定义 向 量 的 最 常用 的 方法 是 
使 用 函数 c). 它 把 若干 个 数值 或 字符 串 组 合 为 一 个 向 量 , 比 如 : 
>x=c(1:3,10:13) 
>x 
[1] 1 23 1011 12 13 
>xl=c(1,2) 
>x2<- c(3,4) 
> x<- c(x] ,x2) 
[1] 1234 
在 显示 向 量 值 时 ,注意 到 左边 出 现 一 个 “[1]”, 这 表示 该 行 的 第 一 个 数 的 下 
标 , 例 如 : 
>12 :78 
[1] 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 
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35 36 
[26] 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 
59 60 61 
[51] 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 
第 二 行 输出 从 第 26 个 数 开始 ,所 以 在 行 左 边 显 示 “ [261”. 
函数 length(x) 可 以 计算 向 量 x 的 长 度 , 例 如 : 
>x<- c(12:78 ) 
>xl=length( x) 
>x] 
[1] 67 
3. 向量 运算 
可 以 对 向 量 进行 加 (+) 、 减 (-)、 乘 ( * ) 、 除 (/)、 乘 方 ( * * 或者) 运算 ， 
其 含义 是 对 向 量 的 每 一 个 元 素 进行 运算 . 例如 : 
>x=c(1,2, 6.25) 
>y=x* *2+1;y 
[1] 2.0000 5. 0000 40. 0625 
另外 ,%/% 表示 整除 (例如 5%/%3=1),%% 表示 求 余 数 ( 例 如 
5% %3=2). 
两 个 等 长 度 向 量 间 进 行 加 、 减 、. 乘 、. 除 和 乘 方 运算 ,其 含义 是 对 应 元 素 间 进 
行 四 则 运算 ,例如 : 
> e(1,2,3)+e(10,20,30)/c(2,4,5) 
[1] 679 : 
两 个 长 度 不 同 的 向 量 间 进行 加 \ 减 .乘除 和 乘 方 运算 时 ,长 度 短 的 将 循环 
使 用 ,但 长 度 长 的 长 度 应 为 短 的 整数 倍 , 例 如 : 
> c(1,2,3)+c(10,20,30,-2,-4,-9,0,0,1) 
[1] 11 22 33 -1 -2 -6 1 2 4 
函数 sqrt log, exp,sin, cos 和 tan 等 都 可 以 用 向 量 做 自 变量 ,结果 是 对 向 
量 的 每 一 个 元 素 取 相 应 的 函数 值 ,例如 : 
> x=e(1, 2, 6.25) 
> sqrt( x) 
[1] 1.000000 1.414214 2. 500000 
上 述 例子 中 出 现 6 位 小 数 , 在 实际 中 有 时 并 不 需要 达到 此 精度 ,可 以 用 命 
令 options( digits=3) 来 控制 结果 的 有 效 位 数 输出 . 例如 : 
>options( digits=3) 
20 
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> sqrt( x) 
[1] 1.00 1.41 2.50 
函数 min 和 max 分 别 取 自 变 量 向 量 的 最 小 值 和 最 大 值 ,函数 sum 计算 自 变量 
向 量 的 元 素 和 ,函数 mean 计算 均值 ,函数 var 计算 样本 方差 ,函数 sd 计算 标 
准 差 .但 注意 , 若 变量 x 为 矩阵 , 则 var( x) 为 协 方差 阵 . 函数 range 返回 包含 最 
小 值 和 最 大 值 的 向 量 . sort(x) 返 回 按 x 的 元 素 从 小 到 大 排序 的 结果 向 量 ， 
order(x) 返 回 使 得 x 的 元 素 从 小 到 大 排序 的 元 素 下 标 向 量 ,但 x[ order(x) ] 等 
效 于 sort(x). 例 如 : 
> 2=c(-3,-9,8,2,;,0,-8) 
> range( z) 
[1] -9 8 
> sort( z) 
[1] -9 -8 -3 0 2 8 
> order( z) 
[1]261543 
> z[ order( z) ] 
[1] -9 -8 -3 0 2 8 
若 想 将 向 量 值 从 大 到 小 排序 ,使 用 函数 sort( z, decreasing = TRUE) 即 可 . 
任何 函数 值 与 缺失 值 的 运算 结果 仍 为 缺失 值 . 例如 : 
> ce(1,2,NA)-ce(1,NA ,4) 
[1] ONA NA 
4. 产生 有 规律 的 数列 
调用 R 的 函数 numeric(n) 可 以 产生 填充 了 n 个 零 的 向 量 .在 R 中 很 容易 
产生 一 个 等 差 数 列 . 例如: 
> n=5 
>l:n 
[1] 12345 
>n:2 
[1] 5432 
> 1:n-1 
[1] 01234 
>1:(n-1) 
[1] 1234 
注意 区 别 1:n-1 与 1:(n-1). 
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seq 孙 数 是 更 一 般 的 等 差 数 列 函 数 . 如 果 只 指定 一 个 自 变 量 n>0, 则 
seq(n) 相 当 于 1:n. 指定 两 个 自 变量 时 ,第 一 个 自 变 量 是 开始 值 ,第 二 个 自 变 
量 是 结束 值 . 如 seq( -2,3) ,也 可 以 写 为 seq(from=-2,to=3). 还 可 以 用 一 个 
参数 by 指定 等 差 数 列 的 步 长 ,by 可 以 放 在 seg 内 任何 位 置 , 例 如 : 

>seg( -2,3) 
[1] -2 -10123 
> seq(from=-2,to=3) 
[1] -2 -10123 
> seq(0,1,0.1) 
[1] 0.00.1 0.20.30.40.50.60.70.80.91.0 
> seq(0,by=0.2,1) 
[1] 0.00.2 0.40.60.8 1.0 
> seq(by=0.2,from=0,1) 
[1] 0.0 0.20.40.60.8 1.0 

也 可 以 用 参数 length 指定 数列 长 度 ,例如 : 

> seq(0 ,length=5) 
[1]01234 

> seq(length=5,to=8) 
[1145678 

seq 函数 还 可 以 用 一 种 seq(along= 向 量 名 ) 的 格式 ,产生 该 向 量 的 下 标 序 

列 ,例如 : 
> w<- c(4,-2,7,0) 
> seq(along=w) 
[1] 1234 

男 一 个 类 似 的 函数 是 rep, 它 可 以 重复 第 一 个 自 变 量 若干 次 ,例如 : 

> rep(w,2) 

[1] 4 -2704-270 

> rep(c(10,28) ,c(2,3) ) 
[1] 10 10 28 28 28 

第 一 个 参数 名 为 变量 名 ,第 二 个 参数 为 times( 重 复 次 数 ). 也 可 以 写 为 
rer (times =2 ,w). 

5. 逻辑 向 量 

问 量 可 以 取 逻 辑 值 ,例如 : 

>1<- ce(TRUE, TRUE, FALSE);1 
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[1] TRUE TRUE FALSE 
> ll <- w>3;11 
[1] TRUE FALSE TRUE FALSE 
一 个 向 量 与 常量 比较 大 小 ,结果 还 是 一 个 向 量 ,元素 为 每 一 对 比较 结果 的 
逻辑 值 . 
两 个 向 量 也 可 以 比较 ,例如 : 
> log(10 * w) 
[1] 3.688879 NaN 4.248495 - Inf( 无 穷 大 ) 
> log(10 * w) >w 
[1] FALSE NA FALSE FALSE 
比较 运算 符 包 括 :<,<=,>=,==( 相 等 )，!= (不 等 ). 
两 个 逻辑 向 量 可 以 进行 与 运算 (&&) .或 运算 ( | ) ,结果 是 对 应 元 素 运算 的 
结果 . 对 逻辑 向 量 1 计算 ! 1 表示 取 每 个 元 素 的 非 . 
> (w>3)&(c(0,3,5,6)<2) 
[1] TRUE FALSE FALSE FALSE 
>! (w>3) 
[1] FALSE TRUE FALSE TRUE 
判断 一 个 逻辑 向 量 是 否 都 为 真 值 的 函数 是 al ,例如 ; 
> all(! (w>3)) 
[1] FALSE 
判断 一 个 逻辑 向 量 是 否 有 真 值 的 函数 是 any ,例如 : 
> any(! (w>3)) 
[1] TRUE 
函数 is. na(x) 用 来 判断 x 的 每 一 个 元 素 是 否 缺 失 ,例如 : 
> is. na(c(1,0,NA)) 
[1] FALSE FALSE TRUE 
逻辑 值 可 以 强制 转换 为 整数 值 ,如 TRUE 变 为 1,FALSE 变 为 0. 例如: 
> age=30 
> c(" young" ," old" )[ (age>65)+1] 
[1] "young" 
6. 字符 型 向 量 


向 量 元 素 可 以 取 字 符 串 值 ,例如 : 
> ecl=ce(" x" ,"tan( x)" ; "年 龄 ") ;c1 
[1]"x" "tan(x)" "年 龄 " 
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函数 paste 用 来 把 它 的 自 变 量 连 成 一 个 字符 串 ,中 间 用 空格 隔 开 ,例如 : 
> paste( "I" ," love" ," homeland" ) 
[1]"I love homeland" 
又 如 : 
> paste(e("X","Y"),"=", 1:4) 
[1]"X = 1" "Y = 2" "X = 3" "Y = 4" 
分 隔 用 的 字符 可 以 用 sep 参数 指定 . 下 例 产 生 若干 个 文件 名 : 
> paste( "result.", 1:5, sep=" ") < 
[1]" result. 1" "result. 2" "result. 3" "result, 4" "result. 5" 
如 果 给 paste( ) 函数 指定 了 参数 collapse , 则 paste( ) 函数 可 以 把 一 个 字符 
串 向 量 的 各 个 元 素 连 接 成 一 个 字符 串 ,中 间 用 collapse 指定 的 值 分 隔 . 例如 : 
> paste( c( "123" ,"234" ) ,collapse=" *") 
[1]"123 * 234" 
7. 向 量 下 标 运算 
访问 向 量 的 某 一 个 元 素 可 以 用 xf[i 订 格式 ,其 中 x 是 一 个 向 量 名 ,或 一 个 
取向 量 值 的 表达 式 ,i 是 一 个 下 标 ,例如 : 
> x=seq(1,8,by=2);x[2] 
[1] 3 
> (e(2,4,6)+(-2))[2] 
[1] 2 
还 可 以 单独 改变 一 个 元 素 的 值 ,例如 : 
> x[2] =125;x 
[1] 1125 57 
R 提供 了 4 种 方法 访问 向 量 的 一 部 分 ,格式 为 x[v] ,x 为 向 量 或 向 量 值 的 
表达 式 ,v 是 如 下 的 一 种 下 标 向 量 . 
( i ) 取 正 整 数值 的 下 标 向 量 
在 x[v] 中 ,* 为 一 个 向 量 ,元 素 取 值 在 1 ~ length(x) 之 间 , 取 值 允许 重复 , 
例如 : 
>x[e(1,3)] 
[1]15 
>x[1:2] 
[1] 1 125 
> xle(1,3,2,1)] 
[1] 1 51251 
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>e("a","b","e")[rep(c(2,1,3),3)] 
[1] "b" "a" we" "b" "a" we" "b" "a" "o" 
( 站) 取 负 整数 值 的 下 标 向 量 
在 x[Lv] 中 ,v 为 一 个 向 量 ,元 素 取 值 在 -length(x) ~ -1 之 间 , 表 示 去 掉 相 
应 位 置 的 元 素 ,例如 : 
> x[e(-1,-3)] 
[1] 1257 
( ñi) 2 38 48 BJ F ka inj Et 
在 x[v] 中 ,> 为 和 x 等 长 度 的 逻辑 向 量 ,xf v] 表 示 取 出 所 有 v 为 真 值 的 元 
素 ,例如 : 
> X>3 
[1] FALSE TRUE TRUE TRUE 
>x [x >3] 
[1] 125 57 
> x[x<(-9)] 
numeric (0) 
可 见 x[x>4] 取 出 所 有 大 于 4 的 元 素 . 这 种 逻辑 值 下 标 是 一 种 强 有 力 的 检 
索 工具 ,例如 x[tan(x)>0] 可 以 取出 x 中 所 有 使 正切 值 为 正 的 元 素 组 成 的 向 
E. 如果 下 标 都 是 假 值 , 则 结果 显示 一 个 长 度 为 零 的 向 量 , 即 numeric(0). 
(Vv ) 取 字符 型 值 的 下 标 向 量 
在 定义 向 量 时 ,可 以 给 元 素 加 上 名字 ,例如 : 
> ages=c(Li=33,zhang=29,Liu=18) 
> ages 
Li zhang Liu 
3 29 18 
这 样 定 义 的 向 量 可 以 用 通常 的 方法 访问 ,另外 ,还 可 以 用 元 素 名 字 来 访问 
元 素 或 元 素 子 集 , 例 如 : 
> ages[ " zhang" ] 
zhang 
29 
> ages[c("zhang", "Li")] 
zhang Li 
29 33 
在 RR 中 还 可 以 改变 一 部 分 值 ,例如 : 
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> x[c(1,3)]=c(188, 189) 
> x 
[1] 188 3 189 7 
注意 赋值 的 长 度 必 须 相 同 。 另 外 ,可 以 把 部 分 元 素 赋 为 一 个 统一 的 值 : 
>x[c(1,3)]<- 0 
> x 
[1]0307 
要 把 向 量 所 有 元 素 赋 为 一 个 相同 的 值 , 可 以 用 x[ ] 格 式 ,例如 : 
>x[ ]=0 
>x 
[1]0000 
但 是 
> x<-0 
> x 
[1] 0 
改变 部 分 元 素 值 的 技术 与 逻辑 值 下 标 方法 结合 ,可 以 定义 向 量 的 分 段 函 
数 . 例如 ,要 定义 
1-x, 当 x < 0, 
y = f(x) -| +， x， 否则 
可 以 用 如 下 语句 : 
> y=numeric( length (x)) 
> y[x<0]=1-x[x<0] 
> y[x>=0]<- 1+x[x>=0] 
>x<- ce(-2.3,4,-5,7) 
>y 
[1] 3.3 5.0 6.08.0 


2.3 矩阵 与 多 维 数 组 


1. 矩阵 | 
R 中 的 矩阵 (matrix) 类 型 和 向 量 类 似 , 是 具有 相同 基本 类 型 (如 整数 、 浮 
点 数 、 字 符 型 ) 的 数据 集合 ,其 中 的 元 素 用 两 个 下 标 访问 . 比如 ,一 个 mxn 矩阵 
A 可 以 保存 在 R 和 矩阵 变量 A 中 ,A 的 第 i 行 第 j 列 元 素 为 A[i,j]. 
函数 matrix( ) 用 来 生成 矩阵 ,其 完全 格式 为 
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matrix( data= NA ,nrow=1,ncol=1, byrow=FALSE ,dimnames = NULL) 
其 中 第 一 自 变量 data 为 数组 的 数据 向 量 (默认 值 为 缺失 值 NA) ,nrow 为 行 数 ， 
ncol 为 列 数 ，byrow 的 取 值 表示 数据 填 入 是 按 行 次 序 还 是 按 列 次 序 . 要 注意 默 
认 情 况 下 为 列 次 序 . dimnames 默认 是 空 值 ,否则 是 一 个 长 度 为 2 的 列表 . 列 
表 的 第 一 个 成 员 是 长 度 与 行 数 相等 的 字符 型 向 量 ,表示 每 行 的 标签 ;列表 的 第 
二 个 成 员 是 长 度 与 列 数 相 等 的 字符 型 向 量 ,表示 每 列 的 标签 . 例如 ,定义 一 个 
3 行 4 列 按 行 由 数据 1:12 依次 排列 的 矩阵 如 下 : 

> A<- matrix(1:12,ncol=4,nrow=3,byrow=TRUE) 

>A 

[,1] [,2] [,3] [,4] 

[1] 1 2 3 4 

[2,] 5 6 7 8 

[3,] 9 10 11 12 

在 有 数据 的 情况 下 只 需 指定 行 数 和 列 数 之 一 . 指定 的 数据 个 数 少 于 所 需 
的 数据 的 个 数 ,这 时 循环 使 用 提供 的 数据 . 例如 : 


> B=matrix(c(1,2) ,ncol=3 ,nrow=4) 


>B 

[,1] [,2][,3] 
[1,] 1 1 1 
[2,] 2 2 2 
[3,] 1 1 1 
[4,] 2 2 2 


用 e(A) 可 以 得 到 将 矩阵 A 的 元 素 按 列 排列 的 向 量 , 在 线性 代数 中 称 为 
“ 按 列 拉 直 ”, 例 如 : 

>c(A) 

[1] 159261037114812 

函数 cbind( ) 把 自 变量 横向 拼 成 一 个 大 矩阵 ,应 数 tbind( ) 把 自 变 量 纵 向 
拼 成 一 个 大 和 矩阵 ,例如 : 

> xl =rbind(c(1,2),e(3,4)) 


> xl 

[,1] [,2] 
[1,] 1 2 
[2,] 3 4 


> x2=cbind(ce(1,2),ce(3,4)) 
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> x2 

[.1] [,2] 
[1 ,]1 3 
[2,]2 4 


2. 访问 矩阵 元 素 和 子 矩 阵 


要 访问 和 矩阵 的 某 个 元 素 , 只 要 写 出 矩阵 变量 名 和 方 括号 内 分 开 的 下 标 即 
可 ,如 A[3,2] 为 10. 也 可 以 给 一 个 矩阵 元 素 赋值 来 修改 该 元 素 .为 了 访问 矩 
FE A 的 第 i 行 ,只 要 用 A[i,] 格 式 即 可 ;类 似 地 ,要 访问 矩阵 A 的 第 j 列 ,只 需 
HAAL, j] 格 式 .为 了 访问 矩阵 中 由 第 让 , 记 ,… ,is 行 和 第 j1,j2,… ,jt 列 交 叉 而 
成 的 子 矩 阵 ,只 要 用 AL c(l ,这 ,is) ,e(jl ,这 ,…,jt)] 格 式 即 可 ,例如 : 

> A[1:2,] 

[,1] [,2] [,3] [,4] 

[1,] 1 2 3 4 

[2,] 5 6 7 8 

> A[1:2,e(1,2,4)] 

[,1] [,2] [,3] 

[1,] 1 2 4 

[2,] 5 6 8 

矩阵 的 行列 下 标 可 以 用 名 字 代 替 . 矩阵 的 每 行 可 以 有 一 个 行 名 ,每 列 可 
以 有 一 个 列 名 ,也 可 以 用 名 字 作 为 下 标 . 定义 行 名 用 函数 rownames( ) ,定义 列 
名 用 函数 colnames( ) .例如 : 

> rownames( À) <— e( "al" ,"a2" ,"a3") 

> colnames( A) <- paste( "x" ,1:4,sep="") 

>A 


a3 9 10 11 12 

> A[ "a2" "x4" ] 

[1] 8 

3. 和 矩阵 运算 

和 矩阵 可 以 进行 四 则 运算 (+,-~,* ,/,“) ,解释 为 矩阵 对 应 的 四 则 运算 , 参 
加 运算 的 矩阵 一 般 应 该 是 相同 形状 的 矩阵 . 例如 ,假设 A,B,C 是 三 个 形状 相 
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同 的 矩阵 , 则 
>D<- C+2 * A/B . 
计算 得 到 的 结果 是 ,A 的 每 一 个 元 素 除 以 B 的 对 应 元 素 再 乘 以 2, 然 后 再 

加 上 C 的 对 应 元 素 ,得 到 相同 形状 的 矩阵 . 形状 不 一 致 的 矩阵 与 向 量 也 可 以 

进行 四 则 运算 . 一 般 的 规则 是 矩阵 的 数据 按 向 量 ( 按 列 拉 直 ) 的 对 应 元 素 进行 

运算 ,并 把 元 素 个 数 少 的 向 量 循环 使 用 ,以便 与 元 素 个 数 多 的 向 量 匹配 , 尽 可 

能 保留 共同 的 形状 . 例如 : 
> A+c( 100,200,300) 

xl x2 x3 x4 

al 101 102 103 104 

a2 205 206 207 208 ' 

a3 309 310 311 312 
结果 是 矩阵 A 按 列 拉 直 后 的 向 量 与 向 量 c(100,200,300) 相 加 ,得 到 12 个 元 
素 ,然后 再 恢复 为 与 矩阵 A 相同 形状 的 矩阵 . 

函数 t( A) E [B] SE BE A 的 转 置 (transpose) 要 进行 矩阵 乘法 运算 ,使 用 运算 
符 % * % ,A% * % B 表示 矩阵 A 乘 以 矩阵 B( 要 求 A 的 列 数 等 于 B 的 行 数 ). 
例如 : 

> B=matrix(c(1,0) ,nrow=4,ncol=2,byrow=T) 

>B 

[,1] [ ,2] 

[1,] 1 O 
[2,] 1 
[3,] 1 

[4,] 1 

> A% *%B 

[,1] [,2] 

al 10 0 

a2 26 0 

a3 42 0 

另外 ,向量 用 在 矩阵 乘法 中 既 可 以 作为 行 向 量 看 待 ,也 可 以 作为 列 向 量 看 
待 ,这 要 看 哪 一 种 观点 能 够 进行 矩阵 乘法 运算 . 例如 , 设 x 是 一 个 长 度 为 n 的 
向 量 ,4 是 一 个 nxn 矩阵 , 则 “x% x wA% = % x” 表 示 二 次 型 x'Ax. 但 是 ， 
“x% x %x” 就 既 可 能 表示 内 积 x'x, 也 可 能 表示 n x n 矩阵 xx'. 因为 前 者 较 常 
用 ,所 以 R 选择 表示 前 者 ,但 内 积 最 好 用 crossprod( ) 来 计算 .对 于 xx' 可 以 用 
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“cbind(x)% +*+ % x” 或 “x % * % rbind(x)”. 

函数 crossprod( X,Y) 表 示 一 般 的 交 又 乘积 ( WR) X'Y,EI X Hgy 
Y 的 每 一 列 的 内 积 组 成 的 矩阵 . 如 果 互 和 了 都 是 向 量 , 则 crossprod(X,Y) 是 
一 般 的 内 积 . 如 果 互 和 了 相同 ,其 内 积 简写 为 crossprod(X) .注意 ,即使 矩阵 乘 
法 或 erossprod( ) 函数 的 结果 是 标量 ,R 仍 会 返回 一 个 1x1 和 矩阵 ,这 时 一 般 用 。 
( ) 函数 把 结果 转换 成 标量 . 

其 他 矩阵 运算 还 有 solve(A,b) , 解 线性 方程 组 4x =b. solve ( A) 求 方 阵 4 
WIERE svd ) 计 算 矩 阵 奇异 值 分 解 ,qr( ) 计 算 QR 分 解 ,eigen( ) 计算 特征 
向 量 和 特征 值 . 函数 diag( ) 的 作用 依赖 于 其 自 变量 . diag( vector) 返 回 以 自 变 
EA EX fA JR HX) fA ERF. diag( matrix) 返 回 由 矩阵 的 主 对 角 元 素 组 成 的 向 
量 ,diag(k)(k 为 标量 ) 返 回 k 阶 单位 矩阵 例如 : 

> C=matrix(1:9, nrow=3,ncol=3,byrow=T) 

> diag( C ) 

[1] 1 5 9 

> diag(c(1:3)) 

[,1] [,2] [,3] 

[1,] 1 0 O 

[2,] 0 2 0 

[3,] 0 0 3 

> diag(3) 

[,1] [,2] [,3] 

[1,] 1 0 O 

[2,] 0 1 0 

[3,] 0 0 1 

4. apply A% 

对 于 向 量 ,我 们 有 sum, mean 等 函数 对 其 进行 计算 . xP T $E RE , n 38 28 x+ 
每 行 (或 每 列 ) 进行 某 种 计算 ,可 以 用 apply( ) 函数 . 其 一 般 形 式 为 

apply(x, margin ,fun,…) 
其 中 x 为 一 个 矩阵 , margin = 1 表示 对 每 行 计算 ,margin =2 表示 对 每 列 计算 . 
fun 是 用 来 计算 的 函数 . 例如 : 

>A 

x x2 x3 x4 
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a3 9 10 11 12 
> apply(A,1,sum) 


al a2 a 
10 26 4 
5. 数组 


矩阵 的 元 素 用 两 个 下 标 访问 ,R 中 用 多 个 下 标 访问 的 数据 结构 是 数组 
(array) .矩阵 是 数组 的 一 个 特例 . 数组 有 一 个 特征 属性 叫做 维 数 向 量 ( dim 属 
性 ) , 维 数 向 量 是 一 个 元 素 取 正 整数 值 的 向 量 ,其 长 度 是 数组 的 维 数 , 比 如 维 
数 向 量 有 两 个 元 素 时 数组 为 二 维 数组 (矩阵). 维 数 向 量 的 每 一 个 元 素 确 定 了 
该 下 标的 上 界 ,下 标的 下 界 总 为 1. 

R 中 任何 一 个 变量 可 以 看 做 一 个 对 象 ,每 个 对 象 中 有 一 些 基本 数据 ,比如 
矩阵 的 各 元 素 值 ;每 个 对 象 除 基本 数据 外 还 可 能 保存 了 与 此 对 象 有 关 的 信息 ， 
称 为 对 象 的 属性 . 任何 一 个 R 对 象 都 有 两 个 固有 属性 一 一 类 型 (mode) MKE 
(length). 不 同 的 R 对 象 支持 不 同 的 属性 ,比如 ,数组 有 dim 属性 ,定义 了 元 素 
名 的 向 量 有 names 属性 . 访问 对 象 x 的 属性 att 常 可 以 采用 att( x) 的 格式 ,给 
属性 赋值 常用 "att(x) <- 新 值 ”的 方法 . 

R 对 象 可 分 为 单纯 的 (atomic) 和 复合 的 (recursive) 两 种 .单纯 对 象 的 所 有 
元 素 都 是 同一 种 基本 类 型 (如 数值 .字符 串 ) ,元 素 不 再 是 对 象 ,这 样 的 对 象 类 
型 有 logical( 逻辑 型 ) .numeric( 数 值 型 ) , complex (复数 型 ) .character( 字 符 
型 ) ,等 等 . 复合 对 象 的 元 素 可 以 是 不 同 的 类 型 ,每 个 元 素 是 一 个 对 象 ,这 样 的 
对 象 的 类 型 用 的 是 列表 . 例如 ,向 量 是 单纯 对 象 , 它 的 所 有 元 素 必须 是 相同 类 
型 ,数值 型 向 量 的 所 有 元 素 必 须 为 数值 型 ,字符 型 向 量 的 所 有 元 素 必 须 为 字符 
型 .列表 是 复合 对 象 ,类 型 为 list, 列 表 的 每 一 个 元 素 ( 变 量 ) 都 可 以 是 一 个 R 
对 象 ,比如 列表 元 素 可 以 为 一 个 数 .一 个 字符 串 、 一 个 向 量 甚至 一 个 列表 . 

一 组 值 只 有 在 定义 了 维 数 向 量 (dim 属性 ) 后 才能 被 看 做 是 数组 . 比如 : 

> z=1:24 

> dim(z) <-c(2,3,4) 

> z 


[,1] [,2] [,3] 
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[1,] 7 9 11 
[2,] 8 10 12 
，，3 
[.1] [ ,2] [,3] 
[1,] 13 15 17 
[2,] 14 16 18 
，4 
[,1] [,2] [,3] 
[1,] 19 21 23 
[2,] 20 2 24 
> dim( z) <-24 
> z 
[11]123456789 1011 12 13 14 15 16 17 18 19 20 21 22 23 24 
数组 元 素 的 排列 次 序 是 按 列 次 序 ,第 一 个 下 标 变化 最 快 ,最 后 一 个 下 标 变 
化 最 慢 . 对 于 矩阵 (二 维 数组 ) , 则 是 按 列 存放 . 例如 ,数组 z 的 各 元 素 次 序 为 
z[1,1,1],z[2,1,1],z[1,2,1],z[2,2,1], z[1,3,1],z[2,3,1],z[1,1,2] ,…， 
z[2,3,4]. 
用 函数 array( ) 可 以 直接 定义 数组 ; 
array( x ,dim=length( x) ,dimnames = NULL) 
其 中 x 是 第 一 自 变量 ,应 该 是 一 个 向 量 , 表 示 数 组 的 元 素 组 成 的 向 量 . dim £ ` 
数 可 省 ,省 略 时 定义 一 维 数组 (但 一 维 数组 不 同 于 向 量 ). dimnames 属性 可 以 
省 略 ,不 省 略 时 是 一 个 长 度 与 维 数 相 同 的 列表 ,列表 的 每 个 成 员 为 一 维 的 名 
=. 例如 上 面 的 z 可 以 这 样 定义 : 
>z<- array(1:24, dim=c(2,3,4)) 
除了 访问 数组 元 素 如 z[1,2,3] ,还 可 以 访问 数组 中 类 位 子 和 矩阵 的 子 集 ， 
比如 z[1:2,2:3,2:3] 是 一 个 维 数 为 c(2,2,2) 的 三 维 数组 , 即 
>> l 
[,1] [,2] 
[1,] 9 1 
[2,] 10 12 
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某 一 下 标 取 一 个 值 , 则 数组 的 维 数 退 化 ,例如 ,zf ,,4] 是 一 个 2x3 和 矩阵， 
z[ ,2,4] 是 一 个 长 度 为 2 的 向 量 . 

数组 的 四 则 运算 与 矩阵 四 则 运算 相似 . 

6. 数组 的 外 积 


两 个 数组 (或 向 量 )a 和 上 b 的 外 积 是 由 a 的 每 一 个 元 素 与 b 的 每 一 个 元 素 
搭配 在 一 起 相 乘 得 到 一 个 新 元 素 ,这 样 得 到 一 个 维 数 向 量 等 于 a 的 维 数 向 量 
与 b 的 维 数 向 量 连 起 来 的 向 量 , 即 若 d 为 a 和 bb 的 外 积 , 则 dimn(d)= 
c(dim(a) ,dim(b) ). 

a 和 上 的 外 积 的 格式 为 a%o%b ,也 可 以 写 为 一 个 函数 调用 的 形式 : 
> d<- outer(a,b,” = '). 例 如 : 

> a=c(1,2) 

> b=c(2:4) 

> d=a% o% b 

>d 

[,1] [,2] [,3] 

[1,] 2 3 4 

[2,] 4 6 8 

outer( a,b,f) 是 一 个 一 般 性 的 外 积 函 数 , 它 可 以 把 a 的 任 一 个 元 素 与 b 的 
任 一 个 元 素 搭 配 起 来 作为 f 的 自 变量 计算 得 到 新 的 元 素 值 . 函数 当然 也 可 以 
包含 加 . 减 、 乘 、 除 ,或 其 他 一 般 函 数 . 当 函 数 为 乘积 时 ,f 可 以 省 略 不 写 . 


例如 ,我 们 希望 计算 函数 2 = LO 在 一 个 * M y 的 网 格 上 的 值 ,用 来 给 


1 + x? 
制 三 维 曲 面 图 . 用 如 下 方法 生成 网 格 及 函数 值 : 
x=seq( -2,2 ,length=20) 
y<-seq( -pi,pi,length=20) 
f<-function( x,y) cos(y)/(1+x’) 
z<—outer(x,y,f) 
persp(x,y,z) 
其 三 维 曲面 图 如 图 2-2 所 示 . 


又 如 ,考虑 简单 的 2x2 3 B |“ ,假设 4 个 元 素 a,b,c, d 是 在 0, 
1,…,9 中 取 值 的 离散 均匀 分 布 的 相互 独立 的 随机 变量 , 求 矩 阵 行列 武 cd - bc 


的 分 布 . 
首先 ,注意 到 随机 变量 ad 和 be 同 分 布 ,其 取 值 由 以 下 外 积 矩 阵 给 出 ,每 
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图 2-2 三 维 曲 面 图 


一 个 取 值 的 概率 均 为 155: 

dl<- outer(0:9,0:9) 
这 个 语句 产生 一 个 10 x 10 外 积 矩 阵 . 

为 了 计算 ad 的 100 个 值 ( 有 重复 ) 与 bc 的 100 个 值 相 减 得 到 的 10000 个 

结果 ,再 使 用 如 下 外 积 函数 : 

d2<-—outer( d1 ,dl1,"-") 
这 样 得 到 一 个 维 数 向 量 为 c(10,10,10,10) 的 4 维 数 组 ,每 一 个 元 素 为 行列 式 
的 一 个 可 能 取 值 ,概率 为 万 分 之 一 . 因为 这 些 值 中 有 很 多 重复 ,我 们 可 以 用 一 
个 table( ) 函数 来 计算 每 一 个 值 的 出 现 次 数 : 

fr<— table( d2) - 
得 到 的 结果 是 一 个 带 有 元 素 名 的 向 量 fr, fr 的 元 素 名 为 行列 式 的 一 个 取 值 fr 
的 元 素 值 为 该 取 值 出 现 的 频数 . 比如 fr[1] 的 元 素 名 为 -81, 值 为 19 ,表示 值 
-81 在 数组 d2 中 出 现 了 19 次 .通过 计算 length ( fr) 可 以 知道 共有 163 个 不 同 
的 值 . 还 可 以 用 这 些 值 用 以 下 命令 绘制 一 个 频数 分 布 图 ( 除 以 10000 则 为 实 
际 概率 ) (图 2-3): 

plot( as. numeric ( names ( fr ) ) , fr, type=" h" , xlab =" Determinant" , 
ylab = " frequency" ) : . 
其 中 as. numeric ( ) 把 向 量 女 中 的 元 素 名 转换 成 了 数值 型 ,用 来 作为 图 的 横 坐 
ER , fr 中 的 元 素 值 ( 即 频数 ) 作 为 纵 轴 ,type =“h”" 表 示 画 垂 线 型 图 . 
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图 2-3 ”随机 矩阵 行列 式 分 布 


2.4 因子 


在 概率 统计 中 ,变量 可 以 分 为 区 间 变 量 、 名 义 变量 和 有 序 变 量 . 区 间 变 量 
取 连 续 的 数值 ,可 以 进行 求 和 、 求 平均 值 等 运算 . 名 义 变量 和 有 序 变 量 取 离 散 
值 ,可 以 用 数值 代表 也 可 以 是 字符 型 值 ,其 具体 数值 没有 加 减 乘除 的 意义 ,不 
能 用 来 计算 只 能 用 来 分 类 或 者 计数 . 名 义 变量 的 例子 如 性 别 、 省 份 . 职 业 等 ,有 
序 变 量 的 例子 如 年 级 名次、 年 龄 组 别 等 . 

1. factor( ) 函数 

因为 离散 型 变量 有 各 种 不 同 表示 方法 ,在 R 中 为 统一 起 见 使 用 因子 (fac- 
tor) 来 表示 这 种 分 类 变量 ,并 提供 了 有 序 因子 (ordered factor) 来 表示 有 序 变 
BL. 因子 是 一 种 特殊 的 向 量 ,其 中 每 一 个 元 素 取 一 组 离散 值 中 的 一 个 ,因子 对 
象 有 一 个 特殊 属性 levels 表示 这 组 离散 值 . 例如 : 

x=c(" 男 "，" 女 "，" 男 " ，" 男 "，" 女 ") 

y=factor(x);y 

[1] 男 k 男 男女 

Levels: 男 女 

函数 factor( ) 用 来 把 一 个 向 量 编码 成 为 一 个 因子 ,其 一 般 形式 为 


factor( x , levels = sort ( unique ( x) , na. last = TRUE ), labels, exclude = NA , 
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ordered = FALSE ) 
可 以 用 来 指定 各 离散 取 值 (水 平 ) ,不 指定 时 由 x 的 不 同 值 来 求 得 . labels 用 来 
指定 各 水 平 的 标签 ,不 指定 时 用 各 离散 取 值 的 对 应 字符 串 . exclude 参数 用 来 
指定 要 转换 为 缺失 值 (NA) 的 元 素 值 集合 . 如 果 指 定 了 levels , 则 因子 的 第 i 个 
元 素 等 于 水 平 中 第 j 个 元 素 时 ,元 素 值 取 j; 如 果 因 子 的 第 ii 个 元 素 没有 出 现在 
levels 中 , 则 对 应 因子 元 素 值 了 到 NA. ordered 取 真 值 时 ,表示 因子 水 平 是 有 次 序 
的 ( 按 编码 次 序 ). 例如: 
f <- factor(c(1,0,1,1,0), levels=c(1,0) ,labels=c(" 男 "," 女 ")) 

结果 和 前 面 的 一 样 . 

可 以 用 is. factor( ) 检 验 对 象 是 否 为 因子 ,用 as. factor( ) 把 一 个 向 量 转 换 
成 一 个 因子 . 因子 的 基本 统计 是 频数 统计 ,用 函数 table( ) 来 计数 .例如 : 

sex=factor(c(" 男 "," 女 "," 男 "," 男 "," 女 ")) 

res. tab <- table( sex) 

> res. tab 

sex 

B k 

3 2 
表示 男性 3 人 ,女性 2 人 ,table( ) 的 结果 是 一 个 带 元 素 名 的 向 量 ,元 素 名 为 因 
子 水 平 ,元 素 值 为 该 水 平 出 现 的 频数 . 

还 可 以 用 两 个 或 多 个 因子 进行 交叉 分 类 . 比如 ,性 别 (sex) 和 职业 (job) 交 
又 分 组 ,可 以 用 table(sex,job) 来 统计 每 一 交叉 类 的 频数 ,结果 为 一 个 矩阵 . $Ë 
阵 带 有 行 名 和 列 名 ,分 别 为 两 因子 的 各 水 平 名 . 

2. tapply ( ) 函数 

tapply( ) 函数 的 一 般 用 法 为 

tapply ( x, INDEX ,FUN = NULL,.…, simplify =TRUE ) 
x 是 一 对 象 ,通常 为 一 向 量 ,INDEX 是 与 x 有 同样 长 度 的 因子 ,FUN 是 要 计算 
的 函数 。 因 子 可 以 用 来 作为 另外 的 同 长 度 变量 的 分 类 变量 . 比如 ,假设 上 面 的 
sex 是 5 个 学 生 的 性 别 ,而 

h<-ce(165 ,170 ,168 ,172 ,159 ) 
是 这 5 个 学 生 的 身高 ,而 

> tapply(h,sex,mean) 
可 以 求 按 性 别 分 类 的 身高 的 平均 值 : 

男 女 
168. 3333 164. 5000 


36 








i 第 2 章 R £ # > 


这 样 用 一 个 等 长 的 因子 向 量 对 一 个 数值 向 量 分 组 的 办 法 称 为 不 规则 数组 
(ragged array). 

3. g1( ) A% 

gl( ) 函数 可 以 方便 地 产生 因子 ,一 般 用 法 为 

gl(n,k,length=n * k,labels = 1 ;n ,odered =FALSE) , 
n 为 水 平 数 ,k 为 重复 的 次 数 length 为 结果 的 长 度 labels 为 n 维 向 量 , 表 示 因 
子 水 平 ,ordered 是 逻辑 变量 ,表示 是 否 为 有 序 因子 , 缺 省 值 FALSE. 

>g1(2,3) 

[1]111222 

Levels: 1 2 

>gl(2,1,6) 

[1]121212 

Levels; 1 2 


2.5 列表 与 数据 杠 


1. 列表 

列表 (list) 是 一 种 特别 的 对 象 集合 , 它 的 元 素 也 由 序号 (下 标 ) 区 分 ,但 是 
各 元 素 的 类 型 可 以 是 任意 对 象 ,不 同 元 素 不 必 是 同一 类 型 . 元素 本 身 允 许 是 其 
他 复杂 数据 类 型 ,比如 ,列表 的 一 个 元 素 也 允许 是 一 个 列表 . 这 样 的 数据 类 型 
称 为 递归 (recursive) 数 据 类 型 . 例如: 

rec=list(name=" 和 黎明" ,age=30,score=c(85,76,90)); rec 

$ name 

[1] "黎明 ， 

`$ age 

[1] 30 

$ score 

[1]85 76 90 
列表 元 素 可 以 用 "列表 名 [[ 下 标 ]] ”的 格式 引用 . 例如 : 

rec[[2]] 

[1] 30 

rec[ [3]][2] 

[1] 76 


37 








”统计 模拟 及 其 RR 实现 E 


但 是 ,列表 不 同 于 向 量 ,每 次 只 能 被 引用 一 个 元 素 , 如 rec[[1:2]] 的 用 法 是 不 
允许 的 . 

注 ; “列表 名 [下 标 ] ”或 “列表 名 [下 标 范围 ]” 也 是 合法 的 ,但 其 意义 与 用 
两 重 括号 的 记 法 完全 不 同 . 两 重 括号 的 记号 表示 取出 列表 的 一 个 元 素 ,结果 
与 该 元 素 类 型 相同 ;如 果 使 用 一 重 括号 , 则 结果 为 列表 的 一 个 子 列表 (结果 类 
型 仍 为 列表 ). 例如 

rec[2] 

$ age 

[1] 30 f 

在 定义 列表 时 如 果 指 定 了 元 素 的 名 字 ( 如 rec 中 的 name、age 和 scores), 
则 引用 列表 元 素 还 可 以 引用 它 的 名 字 作 下 标 ,格式 为 “列表 名 [[ "元素 
名 " ] ]”, 例 如 : 

rec[["age"]] 
[1] 30 
另 一 种 格式 是 “列表 名 $ 元 素 名 ”, 例 如 : 
Tec $ name 

[1j“" 黎 明 " 
而 且 “ 元 素 名 ”还 可 以 简写 到 与 其 他 元 素 能 够 区 别 的 最 小 程度 . 比如 “rec 
$ s” 可 以 代表 “rec $ score”. 这 种 写法 方便 了 交互 运行 ,但 编写 程序 时 一 般 
不 用 简写 ,以 免 降 低 程 序 的 可 读 性 . 

使 用 元 素 名 的 引用 方法 可 以 让 我 们 不 必 记 住 下 标 和 元 素 间 的 对 应 关系 ， 
而 直接 用 易 记 的 元 素 名 来 引用 元 素 .事实 上 ,向 量 和 和 挎 阵 也 可 以 指定 元 素 名 、 
行 名 和 列 名 . 

定义 列表 使 用 list( ) 函数 ,每 一 个 自 变量 变 成 列表 的 一 个 元 素 . 自 变量 可 
以 用 “名 字 = 值 ”的 方式 给 出 , 即 给 出 列表 元 素 名 .， 自 变量 的 值 被 复制 到 列表 
元 素 中 . 自 变量 如 果 是 变量 ,就 不 会 与 该 列表 元 素 建立 关系 (改变 该 列表 元 素 
不 会 改变 自 变量 的 值 ). 

2. 修改 列表 

列表 的 元 素 可 以 修改 ,只 要 把 元 素 引 用 赋值 即 可 , 例如 : 

rec $ age=45 
甚至 可 以 用 以 下 语句 修改 一 个 列表 元 素 : 

rec $ age <- list( 19,29,31) 

如 果 被 赋值 的 元 素 原来 不 存在 , 则 列表 将 延伸 以 包含 这 个 新 元 素 . 例如 ， 
rec 现在 共有 三 个 元 素 ,如 果 定 义 一 个 新 的 命名 元 素 , 则 列表 长 度 变 为 4; 再 定 
38 





“ 第 2 章 R + 绍 % 





义 第 6 号 元 素 , 则 列表 长 度 变 为 6, 例 如: 
rec $ sex<— "H" 
rec[[6]]=161 
rec 
$ name 
[1] "黎明 " 
$ age 
$ age[[1]] 
[1] 19 
$ score 
[1] 85 76 90 
[[5]] 
NULL 
[[6]] 
[1] 161 
第 5 号 元 素 因 为 没有 定义 ,所 以 值 是 “NULL” ,这 是 空 对 象 的 记号 . 如 果 
rec 是 一 个 向 量 , 则 其 空 对 象 为 “NA”, 这 是 缺失 值 的 记号 从 这 里 我 们 可 以 体 
会 “NULL” 与 “NA” 的 区 别 . 
几 个 列表 可 以 用 连接 函数 c( ) 连接 起 来 ,结果 仍 为 一 个 列表 ,其 元 素 为 各 
自 变 量 的 列表 元 素 . 如 : 


list. A = list( name = " wangming" ,age=31 ,weight=45) 





list. B = list ( school = " Qianjin xiao xue" , address =" Wuhan" , grade = 
"class3" ) 

list. AB =c( list. A ,list. B) 

注 : 在 R 中 句点 是 名 字 的 合法 部 分 ,一 般 没 有 特殊 意义 . 

3. 几 个 返回 到 列表 的 函数 

列表 的 重要 作用 是 把 相关 的 若干 数据 保存 在 一 个 数据 对 象 中 ,这 样 在 编 
号 函数 时 我 们 就 可 以 返回 一 个 包含 多 项 输出 的 列表 . 因为 函数 的 返回 结果 可 
以 完整 地 存放 在 一 个 列表 中 ,我 们 可 以 继续 对 得 到 的 结果 进行 分 析 . 例如 : 

( i ) 特 征 值 和 特征 向 量 

函数 eigen (x) 对 对 称 矩阵 x 计算 其 特征 值 和 特征 向 量 ,返回 结果 为 一 个 
列表 . 列表 的 两 个 成 员 ( 元 素 ) 为 values 和 vectors. 例如 : 

ev=eigen( (1:3)% o% (1.3)) 


> ev 
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$ values 
[1] 1.400000e+01 1.484923e-15 1.051986e-16 
$ vectors 

[ ,1] [ ,2] [ ,3] 


[1,] 0.2672612 0.0000000 0.9636241 
[2,] 0.5345225 -0.8320503 -0. 1482499 
[3,] 0.8017837 0.5547002 -0. 2223748 
可 见 三 个 特征 值 只 有 一 个 不 为 零 ( 由 于 数值 计算 精度 所 限 ,第 三 个 特征 值 应 
该 为 零 ,但 结果 只 是 近似 为 零 ). 特征 向 量 按 矩阵 存放 ,每 列 为 一 个 特征 向 量 . 
(站) 奇异 值 分 解 及 行列 式 
函数 svd( HTAR: X= UDV', Hh X EIR n xm 矩阵 ,D 是 
n x n 正 交 阵 ,V 是 m x m 正 交 阵 ,D 是 n x m 对 角 阵 (只 有 主 对 角 线 元 素 大 于 
零 ). svd(X) 返 回 有 三 个 成 员 d,u,v 的 列表 ,d 为 包含 奇异 值 的 向 量 ( 即 忆 的 
主 对 角 线 元 素 ) ,u,v 分 别 为 上 面 的 两 个 正 交 和 矩 阵 . 5 AEE X E Jy EBE , WI 
其 行列 式 的 绝对 值 等 于 奇异 值 的 乘积 , 即 
absddetx=prod(svd(x) $ d) 
或 者 可 以 为 此 定义 一 个 函数 : 
absddet=function(x) prod(svd(x) $ d) 


例如 : 
>y=matrix(c(1,2,3,4,5,8,7,8,9) ,nrow=3,ncol=3) 
>eigen( y) 
$ values 
[1] 17.0369990 -1.5955539 -0.4414451 
$ vectors 


[ ,1] [ ,2] [ ,3] 
[1,] -0.4458227 -0.7803579 -0.92650459 
[2,] -0.5456677 -0.3725544 0.37552991 
[3,] -0.7095695 0.5022398 -0.02380202 
> det(y) 
[1] 12 
> prod(svd(y) $ d) 
[1] 12 
( Hi) QR 分 解 
函数 qr(x) 返 回 x 的 QR 分 解 .矩阵 的 QR 分 解 为 X=QR,Q 为 正 交 逢 
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阵 ,R 为 上 三 角 和 矩阵 . 函数 结果 为 一 个 列表 ,成 员 gr 是 压缩 了 Q Tn R f NB 
一 个 矩阵 ,8 的 信息 压缩 存放 在 下 三 角 部 分 . 结果 中 的 其 他 成 员 为 一 些 辅助 信 
息 .用 qr. QOM qr. R() 可 以 从 qr() 的 结果 中 提取 Q 和 RR. 

4. 数据 框 


数据 框 (data. frame) 是 R 中 的 一 种 数据 结构 . 它 通常 是 矩阵 形式 的 数据 ， 
但 矩阵 各 列 可 以 是 不 同类 型 的 . 而 数据 框 每 列 是 一 个 变量 ,每 行 是 一 个 观测 ， 
且 数 据 框 有 更 一 般 的 定义 . 它 是 一 种 特殊 的 列表 对 象 ,有 一 个 值 为 “data. 
frame” 的 class 属性 ,各 列表 成 员 必 须 是 向 量 ( 数 值 型 字符 型 .逻辑 型 ) 因子、 
数值 型 矩阵 、 列 表 或 其 他 数据 框 . 向 量 、 因 子 成 员 为 数据 框 提供 一 个 变量 ,如果 
向 量 非 数值 型 , 则 会 被 强制 转换 为 因子 ,而 矩阵 、 列 表 、 数 据 框 这 样 的 成 员 为 新 
数据 框 提供 了 和 其 列 数 、 成 员 数 、 变 量 数 相同 个 数 的 变量 . 作为 数据 框 变量 的 
向 量 、 因 子 或 矩阵 必须 有 相同 的 长 度 ( 行 数 ). 

( i) 数据 框 生 成 

数据 框 可 以 用 data. frame( ) 函数 生成 ,其 用 法 与 list( ) 函数 相同 ,对 各 自 
变量 数据 框 的 成 分 , 自 变量 可 以 命名 ,成 为 变量 名 . 例如， 

> d=data. frame( name=c(" 歼 明 "," 张 聪 ", "王建 ") ,age=c(30,35 ,28)， 
height=c(180 ,172 ,177)) 

>d 

name age height 

1 黎明 30 180 

2 张 聪 35 172 

3 王建 28 177 

如 果 一 个 列表 的 各 个 成 分 满足 数据 框 成 分 的 要 求 ,可 以 用 as. data. 
frame( ) 函数 将 其 强制 转换 为 数据 框 . 比如 ,上 面 的 d 如 果 先 用 list( ) 函数 定义 
为 一 个 列表 ,就 可 以 强制 转换 为 一 个 数据 框 . 

一 个 矩阵 可 以 用 data. frame( ) 转换 为 一 个 数据 框 ,如 果 它 原来 有 列 名 , 则 
其 列 名 被 作为 数据 框 的 变量 名 ,否则 系统 自动 为 数据 框 的 各 列 起 一 个 变量 名 . 


例如 : 
> M01 =matrix(c(1:6) ,nrow=3) 
> M01 
[,1] [,2] 
[1,] 1 4 
[2,] 2 5 
[3,] 3 6 
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> data. frame( M01 ) 


X1 X2 
l 1 4 
2 2 5 
3 3 6 
( 站) 数据 框 引用 


引用 数据 框 元 素 的 方法 与 引用 和 矩阵 元 素 的 方法 相同 ,可 以 使 用 下 标 或 下 
标 向 量 ,也 可 以 使 用 名 字 或 名 字 向 量 ,如 d[1:2,2:3]. 数据 框 的 各 变量 也 可 
以 按 列表 引用 ( 即 用 双 括 号 [[ ]] 或 $ 引 用 ). 

数据 框 的 变量 名 由 属性 name 定义 ,此 属性 一 定 是 非 空 的 . 数据 框 的 各 行 
也 可 以 定义 名 字 ,可 以 用 rownames 属性 定义 . 例如 : 

>names( d) 

[1] "name" "age" "height" 

>rownames( d) 

[1] "i" "2" "3" . 

( Hi ) attach ( ) 函数 

数据 框 的 主要 用 途 是 保存 统计 建 模 需要 的 数据 .R 的 统计 建 模 功能 都 需 
要 用 数据 框 来 输入 数据 . 我 们 也 可 以 把 数据 框 当成 一 种 矩阵 来 处 理 . 但 是 ,这 
样 使 用 较 麻烦 ,R 提供 了 attach( ) 函数 ,可 以 把 数据 框 “ 连 接 ” 入 当前 的 名 字 空 
间 . 例如 : 

>attach ( d) 

>r=height/age; r 

[1] 6.000000 4. 914286 6. 321429 
后 一 语句 将 在 当前 工作 空间 建立 一 个 新 变量 r, 它 不 会 自动 进入 数据 框 d. 要 
把 新 变量 赋值 到 数据 框 中 ,可 以 用 如 下 格式 : 

>d $ r=height/age 

为 了 取消 链接 ,只 要 调用 detach( ) (无 参数 ) 即 可 . 

注 :R 中 名 字 空 间 的 管理 是 比较 独特 的 . 它 在 运行 时 保持 一 个 变量 搜索 
路 径 表 ,在 读 取 某 个 变量 时 到 这 个 变量 搜索 路 径 表 中 由 前 向 后 查找 ,找到 最 前 
的 一 个 ;在 赋值 时 总 是 在 位 置 1 赋值 (除非 特别 指定 在 其 他 位 置 ). attach( ) 的 
默认 位 置 是 在 变量 搜索 路 径 表 的 位 置 2,detach( ) 的 默认 位 置 也 是 位 置 2. 

attach( ) 除了 用 来 连接 数据 框 也 可 以 用 来 连接 列表 . 

( iV) 列表 与 数据 框 的 编辑 

可 用 函数 edit( ) 对 列表 或 者 数据 框 进行 编辑 . 
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>newd = edit( d) 

会 出 现 一 个 数据 编辑 窗口 ,可 以 在 此 窗口 进行 编辑 。 当 然 也 可 对 向 量 . 数 
组 、 和 矩阵 类 型 的 数据 进行 修改 和 编辑 . 相 类 似 的 函数 还 有 fix( ). 

函数 merge(x, y,…) 可 以 将 两 个 数据 框 合并 成 一 个 数据 框 , 详 见 “帮助 ” 
中 的 说 明 。 

5. 追踪 对 象 的 函数 . 

函数 ls( ) 可 以 列 出 所 有 定义 过 的 变量 名 ,例如 : 

>ls( ) 

[1] "x" "y" "a" 

函数 str ( 变量 名 ) 列 出 此 变量 名 的 类 型 和 数据 ,例如 : 


>str( d) 
'data. frame’: 3 obs. of 3 variables: 
$ name : Factor w/ 3 levels "黎明 " ," 王建 ",…: 132 


$ age : num 30 35 28 
$ height; num 180 172 177 


2.6 输出 输入 


1. 输出 

在 R 交互 运行 时 要 显示 某 一 个 对 象 的 值 只 要 键 人 其 名 字 即 可 ,例如 : 

>x<-c(1:5); x 

[1] 12345 
这 实际 上 是 调用 了 print( ) 函数 , 即 print( x). 在 非 交 互 运行 (程序 ) 中 应 使 用 
print( ) 来 输出 ,print( ) 函数 可 以 带 一 些 参数 ;digits 指定 每 个 数 输出 的 有 效 数 
字 位 数 ,quote 指定 字符 串 输出 时 是 否 带 两 边 的 括号 ,print. gap 指定 矩阵 或 数 
组 输出 时 列 之 间 的 距离 . 

print( ) 函数 是 一 个 通用 函数 , 即 它 对 不 同 的 自 变 量 有 不 同 的 反应 ， 对 各 
种 特殊 对 象 (如 数组 .模型 结果 等 ) 都 可 以 规定 print 的 输出 格式 . 

cat( ) 函数 也 用 来 输出 ,但 它 可 以 把 多 个 参数 连接 起 来 再 输出 (具有 类 似 
于 paste( ) 的 功能 ). 例如 : 

cat("i=",i," V n") 

注意 使 用 cat( ) 时 要 加 上 换行 符 "\ n". 它 把 各 项 转换 成 字符 串 ,中间 以 
空格 连接 起 来 ,然后 显示 . 如 果 要 使 用 自 定 义 的 分 隔 符 ,可 以 用 sep = 参数 ， 
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例如 : 

>cat(c("AB","e"),c("E","F"),"\n",sep="") 

ABcEF 

cat( ) 还 可 以 指定 一 个 参数 “file= 文 件 名 ” ,把 结果 写 到 指定 的 文件 中 , 例 
如 : 

>cat("i=",1," Vn" ,file="c:/simR/result. txt" ) 
如 果 指 定 的 文件 已 经 存在 , 则 原来 内 容 被 覆盖 . 加 上 一 个 append=TRUE 参数 
可 以 不 覆盖 原文 件 而 是 在 原文 件 末尾 附加 ,这 非常 适用 于 运行 中 的 结果 记录 . 

cat( ) 函数 和 print ( ) 卫 数 都 不 具有 很 强 的 自 定义 格式 功能 ,为 此 可 以 使 
用 cat( ) 函数 和 format( ) 函数 配合 实现 . format( ) 函数 为 一 个 数值 向 量 找 到 一 
种 共同 的 显示 格式 ,然后 把 向 量 转换 为 字符 型 . 例如 

> format( ce ( 1 ,1000 ,10000 ) ) 

[1] "1" "1000" "10000" 

R 还 提供 了 一 个 formatC 函数 ,对 输入 向 量 的 每 一 个 元 素 单独 进行 格式 转 
换 而 不 生成 统一 格式 ,例如 : 

> formatC(c(1,1000 ,10000) ) 

[1] "1" "1000" "le+04" 

在 formatC ( ) 函数 中 可 以 用 format = 参数 指定 C 格式 类 型 ,如 d( 整 数 )、 
人 (定点 实数 ) e 或 E( 科 学 计数 法 ) g 或 G( 选 择 位 数 较 少 的 输出 格式 ) 、 僻 ( 定 
点 实数 但 用 参数 digits 指定 有 效 位 数 而 不 是 总 宽度 ) 以 及 s( 字 符 串 ). 可 以 用 
width 指定 输出 宽度 ,用 digits 指定 有 效 位 数 ( 格 式 为 e.E、g、G A fg Rf) zk JS 
数 点 后 位 数 (格式 为 f) 时 ,可 以 用 flag 参数 指定 一 个 输出 选项 字符 串 . 字符 串 
中 有 “-” 表 示 输 出 左 对 齐 , 有 “0” 表 示 左 空白 用 0 填充 ,有 “+” 表 示 要 输出 正 
负 号 ,等 等 . 例如: 

>formatC(1234. 12345 , digits =3 ,width = 10 ,format= " f" ) 

[1]"1234. 123" 

R 的 输出 默认 显示 在 交互 窗口 .可 以 用 sink ( ) 函数 指定 一 个 文件 用 来 把 
后 续 输 出 转向 到 这 个 文件 ,并 可 以 用 append 参数 指定 是 否 要 在 文件 末尾 附 
加 : 

> sink("C:/simR/result. txt" , append = TRUE) 

>ls( ) 

d 

>sink( ) 

调用 无 参数 的 sink( ) 把 输出 恢复 到 交互 窗口 ， 
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如 果 要 把 矩阵 x 输出 到 文件 中 ,可 以 用 write(t(x) ,file=“ 文 件 名 ”, neol= 
ncol( x) ) 的 形式 .这 里 之 所 以 要 把 x 转 置 后 再 输出 是 因为 R 中 矩阵 是 列 优先 
的 . 如 果 不 转 置 , 则 按 列 输出 . 如 果 不 指定 列 数 , 则 默认 使 用 5 列 ,不管 x 的 列 
数 是 多 少 ,文件 名 默认 将 使 用 data. 

要 把 一 个 数据 框 d 输出 到 文件 中 ,可 用 write. table(x,file=" 文 件 名 " ) , 输 
出 文件 中 包含 变量 名 表 头 和 行 名 . 

2. 输入 

为 了 从 外 部 文件 读 和 一 个 数值 型 向 量 ,R 提供 了 scan( ) 函数 . 如 果 指 定 
T file 参数 (也 是 第 一 个 参数 ) , 则 从 指定 文件 读 人 . 默认 情况 下 读 入 一 个 数值 
向 量 ,文件 中 各 数据 以 空白 分 隔 ,直到 读 完 文 件 为 止 . 例如 : 

cat(1:12,'Vn',file='c;/simR/result01. txt’) 

x=scan( 'c:/simR/result01. txt’) 

如 果 文 件 中 是 一 个 用 空白 分 隔 的 矩阵 (数组 ) ,可 以 先 用 scan ( ) 把 它 读 人 
到 一 个 向 量 ,然后 用 matrix( ) 函数 或 array( ) 函数 转换 . 例如 : 

>y = matrix ( x ,ncol=3 ,byrow = T) 

实际 上 ,scan( ) 函数 也 能 够 读 和 人 一 个 多 列 的 表格 ,只 要 用 what 参数 指定 
一 个 列表 ,该 列表 每 项 的 类 型 为 需要 读 取 的 类 型 . 用 skip 参数 可 以 跳 过 文件 
的 开始 若干 行 不 读 . 用 sep 参数 可 以 指定 数据 间 的 分 隔 符 . 详 见 “帮助 ”文档 
中 的 说 明 . 

如 果 scan( ) 函数 不 指定 读 取 的 文件 名 , 则 是 交互 读 人 , 读 人 时 用 一 个 空 
行 结束 . 

如 果 要 读 取 一 个 数据 框 ,R 提供 了 read. table( ) 函数 . 它 只 要 给 出 一 个 文 
件 名 ,就 可 以 把 文件 中 用 空白 分 隔 的 表格 数据 每 行 读 人 为 数据 框 的 一 行 . 例 
如 : 

w=read. table ('c:/simR/d. txt’, colClass = ( ' character’ ,’' numeric’ ,' charac- 


ter ) ) 


V1 V2 V3 
1 Zhou 15.0 3 
2 Li Ming 9.0 黎明 
3 Zhang 10.2 Wang 


读 人 结果 为 数据 框 ， 函数 自动 为 数据 框 变量 指定 V1、V2 这 样 的 变量 名 ， 
:指定 1、2 这 样 的 行 名 . 可 以 用 col. names 参数 指定 一 个 字符 型 向 量 作为 数据 杠 
的 变量 名 ,row. names 参数 指定 一 个 字符 型 向 量 作为 数据 框 的 行 名 ， 函 数 可 以 
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自动 识别 表 列 是 字符 型 还 是 数值 型 ,并 在 默认 情况 下 把 字符 型 数据 转化 为 因 
F. 这 里 的 第 一 列 和 第 三 列 我 们 并 不 想 转换 ,所 以 人 为 地 加 上 了 一 个 co- 
Classes 参数 ,说 明 每 一 列 的 数据 类 型 . 

对 于 逗号 分 隔 的 文件 用 read. csv( ) 读 取 . 加 上 header=T 参 数 可 以 读 人 
带 有 表 头 的 文件 . 例如 : 

> wl =read. csv('c:/simR/d. csv’, header = T , colClass = e ( ' character’ ,’ nu- 


meric’ ,'character’ ) ) 


>w 
V1 V2 V3 
1 Zhou 15.0 3 
2 Li Ming 9.0 黎明 
3 Zhang 10.2 Wang 


R 中 一 般 不 能 直接 读 xls 文件 ,可 先 转换 为 csv 文件 ,再 用 函数 read. csv( ) 
读 取 ,或 者 利用 扩展 包 xlsReadWrite 中 的 函数 read. xls( ) 进行 读 取 。 

>jlibrary(xlsReadWrite ) 

>d=read. xls("foo. xls" ) 


其 他 一 些 用 法 见 R 的 “帮助 ”中 的 内 容 . 
2.7 程序 控制 结构 


R 是 一 个 表达 语言 ,其 任何 一 个 语句 都 可 以 看 成 是 一 个 表达 式 . 表达 式 之 
间 以 分 号 分 隔 或 用 换行 分 隔 . 表达 式 可 以 续 行 , 若 前 一 行 不 是 完整 的 表达 式 
(比如 末尾 是 加 减 乘 除 等 运算 符 ,或 有 未 配对 的 括号 ) , 则 下 一 行为 上 一 行 的 
继续 . l 

若干 个 表达 式 可 以 放 在 一 起 组 成 一 个 复合 表达 式 ,作为 一 个 表达 式 使 用 . 
组 合用 大 括号 表示 ,例如 : 

l 

x<- 15 

I 

R 也 提供 了 分 支 .循环 等 程序 控制 结构 . 


1. 分 支 结构 
分 支 结 构 包 括 if 结构 : 
过 (条 件 ) 表 达 式 1 
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或 
这 (条 件 ) 表 达 式 1 else 表达 式 2 
其 中 “条 件 ”为 一 个 标量 的 真 值 或 假 值 , 表 达 式 可 以 是 用 大 括号 包围 的 复合 表 
AA. 有 else 子 句 时 一 般 写成 : | 
下 (条 件 ) | 、 
} else I 
表达 式 组 
} 
这 样 的 写法 可 以 使 else 不 至 于 脱离 前 面 的 if. 如 果 变 量 lambda 为 缺失 值 , 就 
给 它 赋 一 个 默认 值 , 即 ， 
if (is. na( lambda) )lambda<- 0. 5 
ERAH x 的 重 对 数 , 这 只 有 在 元 素 都 为 正 且 对 数 都 为 正 时 才能 做 
到 ,因此 需要 先 检查 : 
if(all(x>0) &&all(log(x)>0) I 
y<- log(log(x) ) ; 
print( cbind(x,y) ) ; 
| else | 
cat( 'Unable to comply \ n’); 
| 
注意 %&&” 表 示 “ 与 ”, 它 是 一 个 短路 运算 符 , 即 第 一 个 条 件 为 假 时 就 不 计 
算 第 二 个 条 件 . 如 果 不 这 样 ,此 例 中 计算 对 数 就 可 以 有 无 效 值 . 在 条 件 中 也 可 
以 用 ”| “两 个 连续 的 竖 线 符号 ) 表示 “或 ”, 它 也 是 短路 运算 符 ， 当 第 一 个 条 
件 为 真 时 就 不 需要 计算 第 二 个 条 件 . 
注 : 对 于 计算 重 对 数 的 问题 只 要 判断 al(x>1) 即 可 ,例子 是 为 了 说 明 短 路 
“与 ”. . 
在 用 R 编程 时 一 定 要 牢记 R 是 一 个 向 量 语言 ,几乎 所 有 操作 都 是 对 向 量 
进行 的 . 而 R 中 的 主语 句 却 是 一 个 少见 的 例外 , 它 的 判断 条 件 是 标量 的 真 值 
或 假 值 . 比如 ,我 们 要 定义 一 个 分 段 函数 f(x) , 4 x 为 正 时 返回 1, 否则 返回 
0 ,马上 可 以 想到 用 主语 句 实现 如 下 : 
if(x>0) 1 else 0 
当 自 变量 x 是 标量 时 ,这 个 定义 是 有 效 的 ;但 是 当 x 是 一 个 向 量 时 ,比较 
的 结果 也 是 一 个 向 量 ,这 时 条 件 无 法 使 用 ,所 以 这 个 分 段 函 数 应 该 这 样 编程 : 


> w=matrix( -10:4,ncol=5) 
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> y<- numeric( length(w) ) 
>y[w>0] <- 1 
> y[w<=0]<- 0 
>y 
[1]000000000001111 
有 多 个 过 语句 时 ,else 与 最 近 的 一 个 让 匹配 . 可 以 使 用 if… else if:… else 
if.…else… 的 多 重 判断 结构 表示 多 分 支 ， 多 分 支 也 可 以 使 用 swith( ) 函数 . 
2. 循环 结构 
( i ) for 循环 
循环 结构 中 常用 的 是 for 循环 ,是 对 一 个 向 量 或 列表 的 逐次 处 理 ,格式 为 
for( name in values) 表达 式 
例如 : 
>s<-0 . 
> for(i in seq(along=w)) | 
cat( 'w(',i, ')=',w[i], 'Vn', sep=’ ') 
s<—s+w[ i] 
l 
我 们 在 这 个 例子 中 需要 下 标的 值 ,所 以 用 seq(along=w) 生 成 了 w 的 下 标 
向 量 ， 如 果 不 需 要 下 标的 值 ,我 们 可 以 直接 如 此 使 用 : 
s<-0 
> for(wi inw) | 
cat( wi, ' V n') 
s=s+wi 
| 
当然 ,如果 只 求 各 元 素 的 和 ,只 需 调 用 sum(x) 即 可 .从 这 里 我 们 可 以 看 
出 , 显 式 的 循环 经 常 是 可 以 避免 的 . 利用 函数 对 每 个 元 素 计算 值 ,使 用 sum 等 
统计 函数 及 apply( ) ,lapply( ) ，sapply( ) , tapply( ) 等 函数 可 以 代替 循环 . 因 
为 循环 在 R 中 是 很 慢 的 (R 是 解释 语言 ) ,所 以 应 尽 可 能 避免 使 用 显 式 的 循 
环 . 
我 们 再 举 一 个 例子 . 假设 一 共有 365 个 生日 (只 考虑 月 日 ) ,而 且 各 生日 
的 概率 是 相等 的 (这 里 忽略 了 头 年 的 情况 以 及 可 能 存在 的 出 生日 期 分 布 的 不 
均匀 ). 设 一 个 班 有 m 个 人 , 当 KF 365 H, | 至少 有 两 个 人 生日 相同 } 是 必 
然 事件 . H n 小 于 或 等 于 365 时 ,我 们 可 以 计算 
P| 至 少 有 两 个 人 生日 相同 | =1-Pln 个 人 生日 彼此 不 同 } 
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这 时 nn 个 人 的 生日 可 取 值 个 数 为 365" ,而 个 彼此 不 同 的 可 能 为 365 中 取 n 
个 的 一 个 排列 数 , 即 
365 x 364 x … x (365 - (n - 1)), 
因此 ,为 了 计算 n=1,2,…,365 的 情况 下 的 同 生日 概率 ,可 以 用 如 下 循环 实 
现 : 
> t<-numeric(365 ) 
> for(n in 1:365) | 
t[n]<- 1 
for(j in 0:(n-1))] 
t[n]<- t[n] * (365-j)/365 #t[n] 为 n 个 人 生日 彼此 不 同 
| 
t[n]<-1—-t[ n] 
| 
>t 
用 system. time( process) 可 查看 此 段 程序 的 运行 时 间 为 0. 980 秒 . 我 们 还 
可 以 尽量 用 向 量 运算 来 使 程序 运行 速度 更 快 : 
> t<-numeric (365) 
> for(n in 1:365) | . 
t[n]<- 1-prod ((365:(365-n+l) )/365 ) 
| 
>t 
这 段 程序 只 用 了 0.030 秒 , 比 第 一 个 程序 快 327 倍 . 注意 不 能 直接 去 计算 
3651 ,这 会 超出 数值 表示 范围 . 
这 个 问题 还 可 以 用 R 的 eumprod( ) 函数 进一步 简化 : 
x<- 1-cumprod((365 :1)/365 ) 
这 段 程序 没有 任何 循环 ,运行 时 间 已 经 无 法 测量 . 多 次 重复 运行 可 以 发 
现 它 比 第 二 段 程序 快 165 倍 . 由 此 可 见 ,使 用 向 量 运 算 以 及 利用 系统 提供 的 函 
数 可 以 有 效 提 高 R 程序 的 效率 . 
另外 要 注意 ,使 用 for(i in 1:n) 格 式 的 计数 循环 时 要 避免 一 个 常见 的 错 
误 , 即 当 n 为 零 或 负数 时 ,1:n 是 一 个 从 大 到 小 的 循环 ,而 经 常 需要 的 是 当 n 
为 零 或 负数 时 就 不 进入 循环 . 为 达到 这 一 目的 ,可 以 在 循环 外 层 判 断 循 环 结 
束 值 是 否 小 于 开始 值 . 
( H ) while 循环 
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while 循环 是 在 开始 处 判断 循环 条 件 的 当 型 循环 ,例如 : 
fnl = function( obs=10) | 
x =runif( obs) 
while( mean( x) < 0.45) | 
obs = 2 * obs 
x = runif( obs) 
} 
list(mn=mean(x) ,std=sd(x) ,obs=obs) 
| 
是 一 个 需要 产生 多 少 个 均匀 随机 变量 才能 使 得 它们 的 均值 超过 0.45 的 函数 . 
输出 结果 为 均值 标准 差 和 随机 变量 的 个 数 , 运 行 得 到 结果 : 
>fn1() 
$ mn 
[1] 0.4757144 
$ std 
[1] 0.3377461 
$ obs 
[1] 20 
(iii ) repeat 循环 
repeat 循环 结构 如 下 : 


repeat 表达 式 
在 循环 内 使 用 break 跳出 .在 一 个 循环 体内 用 next 表达 式 可 以 进入 下 一 


轮 循环 . 上 述 程序 中 的 while 循环 可 改写 成 repeat 循环 . 
fn2 = function( obs=10) | 





repeatl 
x=runif( obs) 
if( mean(x) >= 0.45) break 
obs = 2 * obs 
| 


list(mn=mean(x) ,std=sd(x) ,obs = obs ) 


| 
分 支 和 循环 结构 主要 用 于 定义 函数 ,详细 内 容 参 见 R “帮助 "中 的 内 容 . 
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2.8 R 程 序 设计 


对 于 计算 较 复 杂 的 问题 我 们 只 有 通过 编写 程序 才能 解决 . 这 样 做 的 好 处 
是 一 次 编写 程序 可 以 重复 使 用 ,并 且 很 容易 修改 . 另 一 个 好 处 是 函数 内 的 变量 
名 是 局 部 的 ,运行 函数 不 会 使 函数 内 的 局 部 变量 被 保存 到 当前 工作 空间 ,可 以 
避免 在 交互 状态 下 直接 赋值 来 定义 很 多 变量 ,从 而 使 得 工作 空间 不 会 杂乱 无 
章 . 

1. 工作 空间 管理 

前 面 我 们 已 经 提 到 ,R 在 运行 时 保持 一 个 变量 搜索 路 径 表 . 要 读 取 某 变 
量 时 依次 在 此 路 径 表 中 查找 ,返回 找到 的 第 一 个 ;给 变量 赋值 时 在 搜索 路 径 的 
第 一 个 位 置 赋值 ,被 赋值 的 变量 只 在 函数 运行 期 间 有 效 , 在 函数 外 部 ,搜索 路 
径 表 的 第 一 个 位 置 是 当前 空间 . 这 个 工作 空间 将 保存 所 有 在 函数 外 部 定义 的 
变量 以 及 函数 . 

这 样 ,因为 工作 空间 里 对 象 越 来 越 多 ,出 错 的 机 会 就 增 大 了 . 尽量 把 工作 
都 用 函数 实现 可 以 避免 该 问题 ,函数 内 定义 的 变量 是 局 部 的 ,不 会 进入 当前 工 
作 空 间 . 

可 以 直接 管理 工作 空间 中 的 对 象 . 用 ls( ) 函数 可 以 查看 当前 工作 空间 保 
存 的 变量 和 函数 ,用 rm( ) 函数 可 以 剔除 不 想 要 的 对 象 . 例如 : 

> ls() 
[1]"a" "absddet" "absdet.x" "beta" "cprodX" "d" 
”ls() 可 以 指定 一 个 Pattern 参数 ,此 参数 定义 一 个 匹配 模式 ,只 返回 符合 模式 

的 对 象 名 . 比如 ,ls(pattem="tmp[. ]" ) 可 返回 所 有 以 “tmp. ”开头 的 对 象 名 . 

rm( ) 可 以 指定 一 个 名 为 list 的 参数 给 出 要 删除 的 对 象 名 ， 比如 rm ( list = 
ls( pattem =" tmp[.]")) 可 以 删除 所 有 以 “tmp. ”开头 的 对 象 名 ,或 者 直接 用 
rm(list=]s( ) ) 可 删除 所 有 定义 过 的 变量 . 

2. 函数 定义 

R 中 函数 定义 的 一 般 格式 为 

函数 名 <- function ( 参数 表 ) 表 达 式 

定义 函数 可 以 在 命令 行进 行 , 例 如 : 

> hello<-function( ) | 

cat(" Hello, word! \n" ) 
cat(" Vn") 


51 





统计 模拟 及 其 R 实现 N 





] 
函数 体 为 一 个 复合 表达 式 ,各 表达 式 之 间 用 换行 或 分 号 分 开 . 不 带 括号 
调用 函数 时 显示 函数 定义 ,而 不 是 调用 函数 进行 运算 . 
在 命令 行 输入 函数 程序 时 修改 很 不 方便 ,所 以 我 们 一 般 是 打开 一 个 其 他 
的 编辑 程序 ( 如 “记事 本 ”) ,输入 所 需 函 数 定义 ,保存 文件 ,比如 保存 到 了 
c: VXVsimRA \xzh. r( sk JH c:/simR/xzh. r) ,我 们 就 可 以 用 
souree( "c; \\simR \\xzh. r" ) 
运行 文件 中 的 程序 .实际 上 ,用 source( ) 运行 的 程序 不 限于 函数 定义 ,任何 R 
程序 都 可 以 用 这 种 方式 编 好 后 再 运行 ,效果 与 在 命令 行 直接 输入 是 基本 相同 
的 ,只 不 过 不 自动 显示 表达 式 值 ，. 
对 于 一 个 已 有 定义 的 函数 ,可 以 用 fix( ) 函数 来 修改 ,例如 : 
fix( xzh) 
将 打开 一 个 编辑 窗口 显示 函数 的 定义 ,修改 后 关闭 窗口 就 可 以 了 . 
函数 可 以 带 参 数 ,可 以 返回 值 ,例如 : 
> f01<- function(x,y) Í 
z<- x-y 
| 
R 返回 值 为 函数 体 的 最 后 一 个 表达 式 的 值 ,不 需要 使 用 return ( ) 函数 . 不 
过 ,也 可 以 使 用 “return( 对象) ”函数 从 函数 体 返 回调 用 者 . R 只 能 返回 一 个 对 
象 ,所 以 要 返回 多 个 结果 时 需要 用 一 个 列表 把 这 些 结果 包装 起 来 返回 . 
3. 参数 
R 函数 调用 的 方式 很 灵活 ,例如 ,函数 f01 有 两 个 参数 x 和 y, 用 这 个 函数 
计算 100-45 ,可 以 调用 f01(100,45) 或 f01(x=100,y=45) ,或 f01(y=45,x= 
100) ,或 f01(y=45 ,100) £. 调用 时 实 参与 虚 参 可 以 按 次 序 结合 ,也 可 以 直接 
指定 虚 参 名 结合 . 实 参 先 与 指定 了 名 字 的 虚 参 结合 ,没有 指定 名 字 的 按 次 序 与 
剩 下 的 虚 参 结合 . 
函数 在 调用 时 可 以 不 给 出 所 有 的 实 参 ,这 需要 在 定义 时 为 虚 参 指定 默认 
值 . 例如 上 面 的 函数 改 为 
> f01<- function(x,y=0) x-y 
则 调用 时 除了 可 以 用 以 上 的 方式 调用 外 ,还 可 以 用 f01(100) ,f01(x=100) 调 
用 ,只 给 出 没有 默认 值 的 实 参 . 
即使 没有 给 虚 参 指定 默认 值 ,也 可 以 在 调用 时 省 略 某 个 虚 参 ,然后 在 函数 
体内 用 missing( ) 函数 判断 此 虚 参 是 否 有 对 应 实 参 ,例如 : 
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> trans<- function(x,scale) | 


if( ! missing( scale) )x<-x * scale 


l 

此 函数 在 给 出 了 scale 的 值 时 , 才 对 自 变量 x 乘 以 此 值 ,否则 自 变量 x 保 
持原 值 . 这 种 用 法 在 其 他 语言 中 是 极 少见 的 . R 可 以 实现 这 一 点 ,是 因为 R 的 
函数 调用 在 用 到 参数 的 值 时 才 去 计算 这 个 参数 的 值 ( 称 为 “懒惰 求 值 " ) ,所 以 
可 以 在 调用 时 缺少 某 些 参 数 而 不 被 拒绝 . 

4. 作用 域 

函数 的 虚 参 完全 是 按 值 传递 的 ,改变 虚 参 的 值 不 能 改变 对 应 实 参 的 值 . 
例如 : 

> x=list(1," abc") 

> x 

[[1]] 

[1] 1 

[[2]] 

[1] "abc" 

> f=function (x) |x[[2]]="!!";x} 

> f(x) 

[[1]] 

[1] 1 

[[2]] 

[1] "!!" 

函数 体内 的 变量 也 是 局 部 的 ,对 函数 体内 变量 的 赋值 ,在 函数 结束 运行 
后 ,这 些 值 就 被 删除 掉 了 ,不 影响 原来 同名 变量 的 值 . 例如 : 

>x<- 2 : 

> f<- function( ) l 


print( x) 
x<- 20 
| 

> f() 

[1] 2 

> x 

[1] 2 
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这 个 例子 中 原来 有 一 个 变量 x 的 值 为 2 ,函数 中 为 变量 x 赋值 20 ,但 函数 
运行 完 后 原来 的 x 值 并 未 变化 .但 也 要 注意 ;函数 中 显示 出 函数 调用 时 局 部 变 
量 x 还 没有 赋值 ,显示 的 是 全 局 变量 x 的 值 . 这 也 是 R 编程 中 容易 出 问题 的 地 
方 :你 用 到 了 一 个 局 部 变量 的 值 ,但 没有 意识 到 这 个 局 部 变量 还 没有 赋值 ,而 
程序 却 没有 出 错 , 因 为 这 个 变量 已 有 全 局 定义 . 

5. 程序 调试 


对 任何 程序 语言 ,最 基本 的 调试 手段 当然 是 在 需要 的 地 方 显示 变量 的 值 . 
可 以 用 print( ) 或 cat( ) 显 示 . 例如 ,为 了 调试 前 面 定义 的 f01( ) 函数 ( 当然, 这样 
简单 的 程序 实际 是 不 需要 调试 的 ) ,可 以 显示 两 个 变量 的 值 及 中 间 变 量 的 值 : 
> f01=function(x,y) | 
cat( 'x= ',x,'\n’) 
cat('y= ',y,'Vn') 
z=x—y 
cat('z= ', z,'Vn') 
| 
>f01(1,2) 
x= 1 
=2 
z= -1 
[1] -1 
R 提供 了 一 个 browser( ) 函数 , 当 调 用 该 函数 时 程序 暂停 . 可 以 用 ls( ) 列 
出 局 部 变量 ,用 户 可 以 查看 变量 或 表达 式 的 值 , 还 可 以 修改 变量 . 例如 : 
> f01=function(x,y) 1 
browser( ) 
z=x-y 
| 
> f01(11:12,1.3) 
Called from: f01(11:12, 1:3) 
Browse[1]>x 
[1] 11 12 
Browse[1]> y 
[1] 1 2 3 


54 





i 2E R f # P 





Browse[1]> n 
debug: z <- x — y 
Browse[ 1 ] >z 
[1] 10 10 8 
Warning message: 
长 的 目标 对 象 长 度 不 是 短 的 目标 对 象 长 度 的 整 倍数 in:x-y 

程序 在 遇 到 browser( ) 调用 时 进入 调试 状态 ,可 以 查看 其 中 的 局 部 变量 值 
(也 可 以 修改 ). 用 n 命令 可 以 单 步 跟踪 运行 ,在 第 一 次 用 nm 命令 后 只 要 回 车 
就 继续 单 步 跟踪 运行 .退出 R 的 browser( ) 菜 单 可 用 c. A q 可 以 返回 到 命令 

R 提供 了 一 个 debug( ) ES3X ,debug(f01) 可 以 打开 t01( ) 函数 的 调试 . 执 
行 到 函数 f01 时 ,程序 自动 进入 单 步 执行 的 browser( ) 菜单 , 回 车 就 可 以 单 步 
执行 . 用 undebug(f01) 关 闭 调试 . 

6. 程序 设计 举例 

设计 R 程序 是 很 容易 的 ,但 是 如 果 要 用 R 编制 计算 量 较 大 的 程序 ,或 者 
程序 需要 发 表 ,就 需要 注意 一 些 R 程序 设计 的 技巧 .用 R 语言 开发 算法 ,最 重 
要 的 一 点 要 记 住 RR 是 一 个 向 量 语言 . 计算 应 该 尽量 通过 向 量 、 和 矩阵 运算 来 进 
行 ,并 充分 利用 R 提供 的 现成 的 函数 ,避免 使 用 显示 循环 ,因为 R 是 解释 执行 
的 ,所 以 显示 循环 会 大 大 降低 R 的 运算 速度 . 

【 例 2.1】 考虑 某 银行 的 存 取 系 统 . 设 open. account ( ) 为 开户 函数 ， 
deposit( ) 为 存款 函数 ,withdraw( ) 为 取款 函数 ,balance( ) 为 存 取款 平衡 函数 . 
客户 的 存 取 过 程 如 下 : 

open. account = function ( total ) | 

list( 

deposit = function ( amount , total) { 

if( amount = =0) 

stop( " Deposits must be positive! \ n") 

total<<— total + amount 

cat( amount," deposited. your balance is", total," V n \ n") 
l, 

withdraw = function ( amount ,total ) | 

if( amount > total) 

stop( " You don’t have that much money! \ n") 


total<<—total ~ amount 
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cat( amount," withdrawn. Your balance is" ,total," V n \ n") 
I, 
balance =function(total)]  total= total 
cat(" Your balance is" ,total," VnAXn" ) 
total | 
) 
l 
HHWHHHRIHIHIHIHHIHHHHHHHHHH 
>total = 100 
>ross = open. account( total) 
>robert=open. account( 200 ) 
>ross $ withdraw(30) 
30 withdrawn. Your balance is 70 
>ross $ balance( ) 
Your balance is 70 
> robert $ balance( ) 
Your balance is 200 
> ross $ deposit( 50) 
50 deposited. your balance is 120 
> ross $ balance( ) 
Your balance is 120 
> ross $ withdraw (500) 
错误 在 ross $ withdraw(500) : You don’t have that much money! 
[62.2] 考虑 核 回归 问题 
核 回归 是 非 参 数 回 归 的 一 种 ,假设 变量 了 与 变量 之 间 的 关系 为 
Y=fA(X) +e, 
其 中 函数 未知 ,观测 到 于 和 了 的 一 组 样本 : 
[X.,Y,,i=1,2,-. n]. 
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XS 的 一 种 估计 为 








其 中 天 称 为 核 函 数 ,一 般 是 一 个 非 负 的 偶 函 数 ,原点 处 的 函数 值 最 大 ,在 两 侧 
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迅速 趋 于 零 . 例如 正 态 密度 函数 ,或 所 谓 双 三 次 函数 核 : 
ko 人 -5 ll n 
0, 其 他 . 
R 中 的 函数 density ( ) 可 以 进行 核 回 归 估 计 , 我 们 对 这 个 算法 进行 编程 . 首先 
编写 双 三 次 核 函 数 的 程序 ， 
kernel. dcube = function( u) | 
y =numeric( length( u) ) 
y[abs(u)<1]=(1-abs(u[abs(u)<1]) * *3) * *3 
y[abs(u)>=1]=0 
y 
| 
注意 ,上 面 的 分 段 函 数 不 用 这 语 句 而 是 采用 逻辑 向 量 作 为 下 标的 办 法 . 
这 样 定义 出 的 函数 允许 以 向 量 和 数组 作 自 变量 . 
假设 要 画 出 核 估计 曲线 ,一般 取 一 个 范围 与 各 X, 范围 相同 的 等 间距 向 量 
,然后 计算 估计 出 的 作 x) WE. 设 观 测 数据 自 变量 保存 在 向 量 X 中 , 因 变 量 
保存 在 向 量 Y 中 , 则 可 以 写成 下 面 的 程序 : 
kernel. smoothl =function( X , Y ,kernel=kernel. dcube,h=1 ,m=100, 
plot. it=T) | 
x=seq(min( X) ,max( X) ,length=m) 
fx<— numeric( m) 
for(j in 1:m)1 # 计算 第 j 个 等 间距 点 的 回归 函数 估计 值 
fx[j]<- sum(kernel( (x[ j] -X)/h) * Y)/ sum( kernel ( (x[ j] — 
X)/h) ) 
l 
if( plot. it) | # if(plot. it) 可 以 不 要 
plot( X,Y ,type=" Pp") 
lines(x,fx) 
| 
cbind(x=x ,fx=fx) 
l 
注意 ,上 面 的 程序 中 用 了 sum 函数 来 避免 一 重 对 i 的 循环 ,但 是 上 面 的 写 
法 中 仍 有 一 重 对 j 的 循环 ,使 得 程序 运行 较 慢 . 如 何 改 写 程序 ,把 这 个 循环 也 
取消 呢 ? 方法 是 把 计算 看 成 是 和 矩阵 运算 . 首先, 如果 是 一 个 标量 , 则 f(x) 可 
以 改写 成 : 
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K- Y 
f(x) = 天 


其 中 = K( 和 全) 是 一 个 与 长 度 相等 ( 即 长 度 为 n) 的 行 向 量 ,1 是 一 列 1. 


现在 , x 实际 上 是 一 个 长 度 为 m 的 向 量 ,对 %* 的 每 一 个 元 素 可 以 计算 一 个 长 度 
为 n 的 行 向 量 K( 全 六 一 好 .把 这 些 行 向 量 上 下 合并 为 一 个 矩阵 KCm x n) ， 


则 KY 是 长 度 为 m 的 向 量 ,每 一 个 元 素 对 应 于 一 个 x[ 门 .合并 的 矩阵 可 以 用 了 
的 outer( ) 函数 来 计算 : 

>*=function(u,v,kernel,h) kernel( (u-v)Zh) 

>K=outer(x,X,f,kernel=kernel,h=h) # outer( ) 的 第 一 个 自 变量 对 应 于 
结果 和 矩阵 的 行 , 第 二 个 自 变 量 对 应 于 列 

在 分 母 中 ,为 了 计算 每 一 行 的 和 ,只 要 对 天 右 乘 工 , 于 是 结果 的 估计 值 向 
量 为 | 

fx=c( (K% * %Y)/(K % * % matrix(1,ncol=1,nrow=length(Y)))) 
这 样 修改 kernel. smooth1 ,就 可 以 得 到 更 精简 的 函数 kernel. smooth2. 

核 区 归 中 窗 宽 有 的 选择 是 比较 难 的 . 我 们 编写 的 核 回 归 函 数 应 该 允许 用 户 
输入 为 一 个 向 量 .对 向 量 中 每 一 个 徐 宽 计算 一 条 拟 合 曲线 并 画 在 图 中 ,结果 作 
为 函数 返回 值 的 一 列 . 读者 可 以 作为 练习 实现 这 个 函数 ,并 模拟 X 和 了 的 观测 ， 
然后 画 核 估计 曲线 , Ax) 用 sin(a) ,对 我 们 可 能 必须 用 循环 来 处 理 . 


2.9 图 形 


1. 常用 图 形 
R 有 很 强 的 绘图 功能 ,通过 简单 的 函数 调用 ,就 可 迅速 作出 数据 的 各 种 图 
É. ERRET R 的 图 形 技术 之 后 ,也 可 以 设 定 许多 图 形 选 项 来 按 自己 的 要 求 
定制 图 形 . R 的 另 一 个 特色 是 绘图 函数 对 不 同 的 数据 对 象 可 以 作出 不 同 的 图 
J]. 例如 ,假设 数据 文件 class. txt 存储 在 目录 c:/simR/ 下 .用 
ci <- read. table("c:/simR/class. txt" , 
col. names=c( " Name" ," Sex" ," Age" ," Height" ," Weight" ) ) 


李 丽 下 13 148 41 z£ F 13 150 45 
胡 敏 F 14 151 44 Æi F 14 1499 43 
马莉 F 12 143 40 刘 玲 F 13 146 43 
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kÆ F 12 142 40 陈 美玲 F 12 143 41 
KA F 13 150 46 刘 劲 M 14 150 48 
王峰 M 13 151 49 李 明 M 12 146 48 
陈 凯 M 13 148 50 张强 M 13 149 50 
张 勇 M 13 151 52 胡 进 M 14 153 55 
车 丰 M 14 155 58 王建 军 M 12 149 52 


ZF M 12 148 48 
再 用 命令 attach(c1) ;plot( Height) ; plot ( Sex) 分 别 绘制 Height 的 散 点 图 和 Sex 
的 频数 条 形 图 (图 2-4). 我 们 还 可 用 plot( ) 绘 制 两 个 变量 x 与 y 的 散 点 图 . 例 
如 绘制 Height 对 Weight 的 散 点 图 (图 2-5). 











5 l KC 15 F M 
Index 


图 2-4 Height 散 点 图 和 Sex 频数 图 


Regression of Height on Weight 





142 144 146 148 150 152 154 
Height 


图 2-5 Height 对 Weight 的 散 点 
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> plot ( Height, Weight, main = " Regression of Height on Weight" , xlab = 
" Height" , ylab=" Weight" ) 
为 了 绘制 连 线 图 ,只 需 在 plot( ) 函数 中 加 type = " 1" 选项 .例如 用 命令 
>x=0;50 
>plot(x,dchisq(x,10) ,type="1") 
画 出 自由 度 为 10 的 x 分 布 密度 函数 图 (图 2-6). 


0.10 


图 2-6 自由 度 为 10 的 x 分 布 密度 函数 图 


也 可 以 绘制 变量 的 茎 叶 图 . 调用 命令 
>stem( Height) 
可 以 画 出 图 2-7. 


The decimal point is 1 digit(s) to the right of the | 


14 | 233 

14 | 66888999 
15 | 0001113 
15 |5 


图 2-7 Height mE 


绘制 一 个 变量 的 箱 型 图 . 调用 命令 
>boxplot( Weight) 
可 以 画 出 图 2-8. 
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2-8 体重 的 箱 型 图 


也 可 以 绘制 几 个 变量 并 排 的 箱 型 图 . 比如 先 计算 Weight 对 Height 的 回 
归 ,把 拟 合 结果 存 人 pl ,然后 绘制 并 排 盒 形 图 . 

>fitl =1m( Weight ~ Height) 

>pl=predict(fitl,c1);p1 

>boxplot( list( " Weight" = Weight," Predict" =p1) ) 
结果 见 图 2-9. 





Weight Predict 


图 2-9 体重 及 其 预报 箱 型 图 


用 hist( ) 函数 可 以 绘制 直方 图 ,例如 . 
>hist( Weight) 
结果 见 图 2-10. 


61 





i 统计 模拟 及 其 及 实现 x 





Histogram of Weight 


Frequency 
+ 
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图 2-10 体重 的 直方 图 


用 qqnorm( ) 函数 可 以 绘制 正 态 Q-Q 图 ,如 : 
> qqnorm( Weight) 
> qqline(Weight ,col=" red" ) 

结果 见 图 2-11. 


Normal Q-Q Plot 


55 


Un 
© 


Sample Quantiles 
+ 
an 


40 





-2 -1 0 1 2 
Theoretical Quantiles 


图 2-11 体重 的 正 态 Q-Q 图 
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2. 高 级 图 形 范 数 


R 的 图 形 函 数 分 为 两 类 :高 级 图 形 函 数 一 - 直接 绘制 图 形 并 可 自动 生成 
坐标 轴 等 附属 图 形 元 素 ; 低 级 图 形 函 数 可 以 修改 已 有 的 图 形 或 者 为 绘图 
规定 一 些 选项 . 高 级 图 形 函 数 总 是 以 一 个 新 图 开始 . 下 面 介绍 常用 的 高 级 图 形 
函数 ,以 及 用 来 修饰 这 些 高 级 图 形 孙 数 的 常用 可 选 参数 . 

最 常用 的 是 plot( ) 函数 . 比如 plot( x,y) (其 中 x,y 是 向 量 ) 对 两 个 变量 画 
散 点 图 . 如 果 z 是 一 个 定义 了 x 变量 和 y 变量 的 列表 或 者 一 个 两 列 的 矩阵 , 则 
用 plot(z) 也 可 以 画 散 点 图 . 如 果 x 是 一 个 时 间 序 列 对 象 ( 时 间 序 列 对 象 用 
ts( ) 83 E BE) , 则 plot(x) 绘 制 时 间 序 列 曲线 图 . 如 果 x 是 一 个 普通 向 量 , 则 
绘制 x 的 值 对 其 下 标的 散 点 图 . 如 果 x 是 一 个 复数 向 量 , 则 绘制 虚 部 对 实 部 的 
散 点 图 . 如 果 f 是 一 个 因子 , 则 plot(f) 绘制 f 的 条 形 图 (每 个 因子 水 平 的 个 
数 ). 如果 f 是 一 个 因子 ,y 是 长 度 相同 的 数值 向 量 , 则 plot(f,y) 对 的 每 一 个 
水 平 绘制 y 中 相应 数值 的 盒 形 图 . 如 果 d 只 是 一 个 数值 型 数据 的 数据 框 , 则 
plot(d) 对 d 的 每 两 个 变量 之 间作 图 ( 散 点 图 等 ) . 

如 果 X 是 一 个 数值 型 矩阵 或 数据 框 , 则 用 plot(X) 可 以 绘制 每 两 列 之 间 
的 散 点 图 矩阵 . 这 样 变量 个 数 不 太 多 时 ,可 以 同时 看 到 多 个 变量 之 间 的 两 两 关 
系 ; 变 量 个 数 太 多 时 , 则 每 个 图 太 小 ,意义 不 大 . 

协同 图 ( coplot) 是 一 种 多 变量 探索 性 分 析 图 形 ,其 形式 为 coplot(y ~ 
x |z) ,其 中 x 和 y 是 数值 型 向 量 ,z 是 同 长 度 的 因子 . 对 z 的 每 一 水 平 绘制 相 
应 组 的 x 和 y 的 散 点 图 . 例如 : 

coplot( Weight ~ Height | Sex) 
结果 见 图 2-12 ,对 不 同性 别 分 别 绘制 了 体重 对 身高 的 散 点 图 . 如 果 z 是 一 个 数 
值 型 变量 , 则 coplot( ) 先 对 z 的 取 值 分 组 ,然后 对 z 的 每 一 组 取 值 分 别 绘 图 . 其 
至 可 以 用 如 coplot (y ~x | xl+x2) 表 示 对 xl 和 x2 的 每 一 水 平 组 合 绘图 . 
coplot( ) 和 pairs( ) 函数 默认 绘制 散 点 图 ,但 可 以 用 一 个 panel 参数 指定 其 他 的 
低级 绘图 函数 ,如 lines panel, smooth 等 . 

qqnorm(x) 、qqline(x) 、qqplot(x,y) 作 分 位 数 一 分 位 数 图 . qqnorm(x) 对 向 
量 x 作 正 态 概率 ( 纵 轴 为 次 序 统计 量 , 横 轴 为 对 应 该 次 序 统计 量 的 标准 正 态 分 
布 分 位 数 ). qqline(x) 在 qqnorn(x) 图 上 画 一 条 拟 合 曲线 . qqplot(x,y) 把 x 和 
y 的 次 序 统计 量 分 别 画 在 x 轴 和 y 轴 上 以 比较 这 两 个 变量 的 分 布 . 

hist(x) 作 向 量 x 的 直方 图 . 默认 时 自动 确定 分 组 ,也 可 以 用 nelass 参数 指 
定 分 组 个 数 ,或 者 用 breaks 参数 指定 一 个 分 组 点 向 量 . 如果 指 定 了 prob =T, 则 
纵 轴 显 示 密 度 估计 . 

R 也 可 以 作 三 维 图 、 等 值 线 图 和 等 值 色 图 ,相应 的 函数 分 别 为 persp( ) 、 
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Given:Sex 





142 144 146 148 150 152 154 





142 144 146 148 150 152 154 
Height 


图 2-12 不 同性 别 的 体重 对 身高 的 散 点 图 


contour( ) 和 image( ) ,例如 : 
>x=seq( -3,3,length=100) 
>y=x 
>f=function(x,y,ssql =1,ssq2=2,rho=0.5) | 
detl =ssql * ssq2 * (1-rho’2) 
sl =sqrt( ssql ) 
s2=sqrt( ssq2 ) 
1/(2 * pi * sqrt( det1) ) * exp(—0.5/detl * (ssq2 * x2+ssql * y 2 
—2 *rho * sl * s2 * y) ) 
l 
>z=outer(x,y,f) 
>persp(x,y,z) 
>contour( x,y,z) 
>image( x,y,z) 
结果 见 图 2-13. 
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图 2-13 三 维 图 .等 值 线 图 和 等 值 色 图 


3. 高 级 图 形 函 数 的 常用 选项 
高 级 图 形 函 数 有 一 些 共 同 的 选项 ,作为 函数 的 可 选 参 数 ( 自 变 量 ). 例如 : 
plot(x, main = " Graph of x" ) 


其 中 的 main 就 是 一 个 可 选 参数 ,用 来 指定 图 形 的 标题 . 没有 此 选项 图 形 就 没 
有 标题 . 表 2-1 列 出 了 这 样 的 选项 . 


表 2-1 高 级 图 形 选 项 
本 使 函数 像 低 级 图 形 函 数 那样 ,不 是 绘制 一 个 新 图 形 而 是 在 原 图 
基础 上 添加 


暂 不 画 坐 标 轴 ,随后 可 以 用 axis( ) 函数 更 精确 地 规定 坐标 轴 的 











`. 画 法 . 默认 值 是 axes=T, 即 有 坐标 轴 

log= “x” 用 对 数 刻 度 绘 制 x 轴 、y 轴 

jog= “y” 

log= “xy” 

type = 规定 绘画 方式 

type= “p” 绘 点 

type= “1” 绘 线 

type=“b” 绘 点 并 在 之 间 用 线 连接 

type= “o” 绘 点 并 画 线 穿 过 各 点 

type=“h” 从 点 到 横 轴 画 垂 线 

type= “s” 阶梯 函数 : 左 连续 

type= “S” 阶梯 函数 : 右 连 续 

pese 不 画 任何 点 ` 线 ,但 仍 画 坐 标 轴 并 建立 坐标 系 ,适用 于 后 面 介绍 
的 用 低级 图 形 函 数 作 图 

xlab = “字符 串 ” 定义 x 轴 和 y 轴 的 标签 . 默认 时 使 用 对 象 名 

ylab= "字符 串 ” 

main = “字符 串 ” 图 形 的 标题 

sub=“ FR” 图 形 的 小 标题 ,用 较 小 字体 画 在 x 轴 下 方 
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4. 低 级 图 形 函 数 

高 级 图 形 函 数 可 以 迅速 简便 地 绘制 常见 类 型 的 图 形 ,但 是 , 某 些 情 况 下 可 
能 希望 绘制 一 些 有 特殊 要 求 的 图 形 . 比如 ,希望 按照 自己 的 设计 绘制 坐标 轴 ， 
在 已 有 的 图 上 增加 另 一 组 数据 ,在 图 中 加 入 一 行文 本 注释 , 绘 出 多 条 曲线 代表 
的 数据 的 标签 ,等 等 .低级 图 形 函 数 可 以 在 已 有 图 的 基础 上 进行 添加 . 

表 2-2 列 出 了 常用 的 低级 图 形 函 数 . 低级 图 形 函 数 一 般 需要 指定 位 置信 
息 ,其 中 的 坐标 指 的 是 用 户 坐标 , 即 前 面 的 高 级 图 形 函 数 所 建立 的 坐标 系 中 的 
坐标 . 坐标 可 以 用 两 个 向 量 x # y 给 出 ,也 可 以 由 一 个 两 列 的 矩阵 给 出 . 如 果 
交互 作 图 , 则 可 以 用 下 面 介绍 的 locator( ) 函数 来 交互 地 从 图 形 中 直接 输入 坐 


标 位 置 . 


3 2-2 
points(x,y) 
lines(x,y) 
rug( x) 
rug(x,side=2) 


text( x,y,labels,.…) 


低级 图 形 函 数 
在 当前 图 形 上 到 加 一 组 点 或 线 . 可 以 使 用 plot( ) 的 type 参数 来 
指定 绘制 方式 ,默认 时 points( ) 画 点 ,lines( ) 画 线 
rug(x) 在 x 轴 上 用 一 些 短 刻 度 线 表 示 观 测 郊 数 的 x 数 值 . rug(x， 
side=2) 可 以 把 观测 的 短线 画 在 y 轴 上 
在 坐标 x 和 y 给 出 的 位 置 标 出 由 labels 指定 的 字符 串 . labels 可 
以 是 数值 型 或 字符 型 的 向 量 ,labels[ ij 在 x[i 和 了 7[i 标 出 








polygon( x,y,*…) 





按 向 量 x 给 出 的 横 坐 标 和 向 量 y 给 出 的 纵 坐 标 确定 顶点 ,绘制 
多 边 形 . 可 以 用 col 参数 指定 用 某 种 颜色 填充 多 边 形 内 部 





abline(a,b) 
abline(h=y) 
abline( v=x) 


abline( Im. obj) 


legend( x,y, 
legend, ) 


legend( ,angle=v) 
legend( , density =v) 
legend( ,fill= v) 
legend( ,col=v) 
legend( ，lty=Y) 
legend( ，pch=v) 
legend( ，vect=v) 
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在 当前 图 形 上 画 一 条 直线 . 两 个 参数 a、b 分 别 给 出 截 距 和 和 斜率 . 
指定 h 参数 时 绘制 水 平 线 ,指定 v 参数 时 绘制 垂直 线 . 以 一 个 最 
小 二 乘 拟 合 结果 lm. obj 作为 参数 时 ,由 lm. obj 的 coefficient 成 
员 给 出 直线 的 截 距 和 斜率 


legend 函数 用 来 在 当前 图 形 的 指定 坐标 位 置 绘制 图 例 , 图 例 的 
说 明文 字 巾 向量 legend 提供 . 至 少 要 给 出 下 面 的 v 值 以 确定 要 
对 什么 图 例 进行 说 明 ,v 是 长 度 与 legend 相同 的 向 量 

angle 参数 指定 几 种 阴影 斜 度 

density 参数 指定 几 种 阴影 密度 

fill 参数 指定 几 种 填充 颜色 

col 参数 指定 几 种 颜色 

lty 参数 指定 几 种 线 型 

pch 参数 指定 几 种 散 点 符号 ,为 字符 型 向 量 

vect 参数 也 指定 几 种 散 点 符号 ,为 字符 型 向 量 


续 表 









title( main , sub) 


绘制 由 main 指定 的 标题 和 由 sub 指定 的 小 标题 
绘制 一 个 坐标 轴 . 之 前 的 绘图 函数 必须 已 经 用 axes=F 选项 抑制 
了 自动 的 坐标 轴 . 参数 side 指定 在 哪 一 边 绘制 坐标 轴 , 取 值 为 1 
“到 4,1 为 下 边 ,然后 逆 时 针 数 .可 以 用 at 参数 指定 位 置 ,用 labels 
参数 指定 刻度 处 的 标签 






axis( side,- ) 


5. 交互 图 形 函 数 


R 的 低级 图 形 函 数 可 以 在 已 有 图 形 基础 上 添加 新 内 容 , 另 外 ,R 还 提供 了 两 
个 函数 locator( ) 和 identify( ) ,可 以 让 用 户 通 过 在 图 中 点 击 鼠 标 来 确定 位 置 . 

函数 locator(n ,type) 运 行 时 会 停 下 来 等 待 用 户 在 图 中 点 击 , 然 后 返回 图 
形 中 鼠标 点 击 的 位 置 的 坐标 . 等 待 时 点 击 鼠 标 右 键 可 以 选择 停止 等 待 ,立即 返 
回 .参数 n 指定 点 击 多 少 次 后 自动 停止 ,默认 为 500 次 ;如 果 使 用 参数 type, W 
可 指定 绘 点 类 型 ,与 plot( ) 函数 中 的 type 参数 用 法 相同 ,在 鼠标 点 击 处 绘 点 
(RER, FE). locator( ) 返 回 值 是 一 个 列表 ,有 两 个 变量 (元 素 )x 和 y, 分 
别 保 存 点 击 位 置 的 横 坐 标 和 纵 坐 标 . 

例如 ,为 了 在 已 经 绘制 的 曲线 图 中 找 一 个 空白 处 标 上 一 行文 本 ,只 需 使 用 
如 下 程序 : 

> text( locator( 1 ) ," Normal density" ,adj=0) 

text( ) 函数 的 adj 参数 用 一 个 数字 表示 文本 串 相 对 于 给 定 的 坐标 的 画 法 ， 
adj=0 表示 给 定 坐标 为 文本 串 左 侧 的 坐标 ,adj = 1 表示 给 定 坐 标 为 文本 串 右 
侧 的 坐标 ,adj=0.5 表示 给 定 坐标 为 文本 串 中 间 的 坐标 . 

函数 (x,y ,labels) 在 运行 时 会 停 下 来 等 待 用 户 点 击 , 待 用 户 点 击 后 ,返回 
用 户 在 图 形 中 点 击 的 点 的 序号 ,点 击 时 对 点 击 的 点 加 标签 .参数 x # y 给 出 要 
识别 的 各 个 点 的 坐标 . labels 参数 指定 点 击 某 个 点 时 要 在 旁边 绘制 文本 标签 ， 
默认 时 标 出 此 点 的 序号 . 如 果 只 需要 返回 值 而 不 想 画 任何 标记 , 则 可 以 在 调用 
此 函数 时 加 一 个 参数 plot = 下 参数 . 

注意 ,locator( ) 与 identify( ) 不 同 ,locator( ) 返回 图 中 任意 点 击 位 置 的 坐 
标 ,而 identify( ) 只 返回 离 点 击 位 置 最 近 的 点 的 序号 . 

例如 ,我 们 在 向 量 x # y 中 有 若干 个 点 的 坐标 ,运行 程序 如 下 : 

>plot(x,y) 

>identify (x,y) ， 
这 时 显示 转移 到 图 形 窗口 ,进入 等 待 状态 . 用 户 可 以 点 击 图 中 特别 的 点 ,该 点 
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的 序号 就 会 在 旁边 标 出 . 只 要 单 击 右 键 并 选择 停止 ,就 可 以 结束 运行 . 返回 结 
果 为 所 点 击 的 各 个 点 的 序号 ， 

6. 图 形 参数 的 使 用 

前 面 我 们 已 经 看 到 用 main 、xlab ylab 等 参数 来 规定 高 级 图 形 函 数 的 一 些 
设置 . 在 实际 绘图 中 ,特别 是 绘制 用 于 演示 或 出 版 的 图 形 时 ,用 R 默认 设置 给 
制 的 图 形 往往 不 能 满足 要 求 . R 提供 了 一 系列 图 形 参 数 , 通 过 使 用 图 形 参数 可 
以 修改 图 形 显 示 的 、 所 有 各 方面 的 设置 . 图 形 参 数 包括 线 型 . 颜色、 图形 排列 、 
文本 对 齐 方式 等 各 种 设置 . 每 个 图 形 参 数 有 一 个 名 字 , 比 如 col 代表 颜色 ， 
col= " red" 表示 红色 . 每 个 图 形 设备 有 一 套 单独 的 图 形 参数 . 

设置 图 形 参 数 分 为 两 种 ,长 效 设置 与 临时 设置 . 长 效 设置 使 用 par( ) 函数 
进行 设置 ,设置 后 在 退出 前 一 直 保持 有 效 ; 临 时 设置 则 是 在 图 形 函 数 中 加 入 图 
形 参数 ,如 上 面 例子 中 的 adj 参数 : 

text( locator( 1) ," Normal density" ,adj=0) 

par( ) 函数 用 来 访问 或 修改 当前 图 形 设备 的 图 形 参 数 . 如果 不 带 参 数 调 
用 ,例如 : 

par( )# 显 示 如 下 结果 

$ xlog 
[1] FALSE 
$ ylog 
[1] FALSE 
$ adj 
[1] 0.5 
$ ann 
[1] TRUE 
结果 为 一 个 列表 ,列表 的 各 元 素 名 为 图 形 参数 名 ,元 素 值 为 相应 图 形 参数 的 取 
值 . 如 果 调 用 时 指定 一 个 图 形 参 数 名 的 向 量 作为 参数 , 则 只 返回 被 指定 的 图 形 
参数 的 列表 : 

>par(c(" col" ," lty" )) 

$ col 

[1] "black" 

$ lty 

[1] "solid" 

调用 时 指定 名 字 为 图 形 参数 的 有 名 参数 , 则 修改 指定 的 图 形 参数 ,并 返回 
原 值 的 列表 : 
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>oldpar=par(col=4,lty=2) 

> oldpar 

$ col 

[1] "black" 

$ lty 

[1] "solid" 

因为 用 par( ) 修改 图 形 参数 是 保持 到 退出 以 前 都 有 效 的 ,而 且 即 使 是 在 
函数 内 部 此 修改 仍 是 全 局 的 ,所 以 我 们 通常 利用 如 下 方法 ,在 完成 任务 后 恢复 
原来 的 图 形 参 数 : 

oldpar =par(col=4,lty=2) 

een (需要 修改 图 形 参 数 的 绘图 任务 ) 

par( oldpar)# 恢 复原 始 的 图 形 人 参数 

除了 像 上 面 那 样 用 par( ) 函数 永久 修改 图 形 参 数 外 ,还 可 以 在 几乎 任何 
图 形 函 数 中 指定 图 形 参 数 作为 有 名 参数 ,这样 的 修改 是 临时 的 ,只 对 此 函数 起 
作用 . 例如 : 

plot(x,y,pch="+") 
就 是 用 图 形 参数 pch 指定 了 绘制 散 点 的 符号 为 “加 号 ”. 这 个 设 定 只 对 这 一 幅 
图 有 效 ,对 其 他 的 图 形 没 有 影响 . 

7. 图形 参 数 详解 

鉴于 绘制 有 特殊 需要 的 图 形 是 R 的 一 个 强项 ,而 使 用 图 形 参数 是 完成 此 
类 任务 的 重要 手段 ,因此 我 们 在 这 里 较 详细 地 介绍 R 的 各 种 图 形 参数 . 这 些 
图 形 参 数 可 以 大 体 上 分 为 以 下 几 大 类 : 

。 图 形 元 素 控 制 ; 

e° 坐标 轴 与 坐标 刻度 ; 

° 图 形 边 空 ; 

。 一 页 多 图 . 

( i ) 图 形 元 素 控制 

图 形 由 点 、 线 、 文 本 、 多 边 形 等 元 素 构成 . 下 列 图 形 参数 用 来 控制 图 形 元 
素 的 绘制 细节 : 

。 pch=“+” 指定 用 于 绘制 散 点 图 的 符号 . 绘制 的 点 往往 略 高 于 或 略 低 

于 指定 的 坐标 位 置 , 只 有 pch=“ “没有 这 个 问题 . 
° pch=4 如 果 pch 的 值 为 0 ~ 18 之 间 的 一 个 数字 ,将 使 用 特殊 的 绘 点 
符号 (图 2-14). 
下 例 可 以 显示 所 有 特殊 绘 点 符号 : 
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>plot(e(0,100) ,c(0,100) ,type="n", axes=F,xlab=' ',ylab=' ') 
>legend( 10,90 , as. character(0:9) ,pch=0:9) 
>legend (50,90 ,as. character( 10:18) ,pch=10:18) 


* P o m E HË OQ 





口 0 
ol 
A 2 
十 3 
X 4 
° 5 
v 6 
B 7 
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2-14 ”特殊 绘 点 符号 


° lty=2 指定 画 线 用 的 线 型 . 默认 值 ly=1 是 实 线 , 从 2 开始 是 各 种 虚 
线 . 

° lwd=2 指定 线 的 粗细 ,以 标准 线 粗细 为 单位 . 这 个 参数 影响 数据 曲 
线 的 线 宽 以 及 坐标 轴 的 线 宽 . 下 例 绘制 余 割 曲线 图 (图 2-15). 

>oldpar= par( lwd =2) 

> x=seq( -10,10,0.5) 

>ch=function(x) ( exp( x) +exp( —x) )⁄2 

> plot(x,ch(x) ,type="1") 

> par( oldpar) 

° col 指定 颜色 ,可 应 用 于 绘制 点 、 线 、 文 本 填充 区 域 和 图 像 . 颜色 值 
也 可 以 用 red blue 这 样 的 颜色 名 指定 . 函数 colors( ) 的 结果 为 R 中 定 
义 的 颜色 向 量 . 

° font=2 指定 字体 . 一 般 情况 下 ,font=1 表示 正体 ,font=2 表示 黑体 ， 
font=3 表示 斜体 ,font=4 表示 黑 斜 体 . 

è font. axis.font. lab font. main 和 font. sub 分 别 用 来 指定 坐标 刻度 、 坐标 
轴 标 签 、 标题. 小 标题 所 用 的 字体 . 

° adj=-0.1 指定 文本 相对 于 给 定 坐 标的 对 齐 方式 . 取 0 表示 左 对 齐 ， 
取 1 表示 右 对 齐 , 取 0.5 表示 居中 . 此 参数 的 值 实际 代表 的 是 出 现在 
给 定 坐标 左边 的 文本 的 比例 ,所 以 adj= -0. 1 的 效果 是 文本 出 现在 给 
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图 2-15 余 害 曲线 图 


定 坐 标 位 置 的 左边 ,并 空 出 相当 于 文本 10% 长 度 的 距离 . 
cex= 1.5 ”指定 字符 放大 倍数 (可 以 不 取 整 数 ). 


( 让) 坐标 轴 与 坐标 刻度 

许多 高 级 图 形 带 有 坐标 轴 ,也 可 以 先 不 画 坐 标 轴 ,其 后 用 axis( ) 单独 加 . 
函数 box( ) 用 来 画 坐 标 区 域 四 周 的 框 线 . 

坐标 轴 包 括 三 个 部 件 一 一 轴线 (用 lty 可 以 控制 线 型 ) 、 刻 度 线 和 刻度 标 
签 .它们 可 以 用 如 下 的 图 形 参 数 来 控制 : 


lab=c(5,7,12) ”第 一 个 数 为 x 轴 上 画 的 刻度 线 数 , 第 二 个 数 为 y 轴 
上 画 的 刻度 线 数 ,这 两 个 数 是 建议 性 的 . 第 三 个 数 是 坐标 刻度 数值 的 
宽度 , 按 字符 数 计 算 ,包括 小 数 点 . 此 宽度 取得 太 小 会 使 各 刻度 数值 
四 售 五 人 成 相同 的 值 . 
las=1 坐标 刻度 标签 的 方向 . 0 表示 总 是 平行 于 坐标 轴 ,1 表示 总 是 
水 平 ,2 表示 总 是 垂直 于 坐标 轴 . 
mag=c(3,1,0) 坐标 轴 各 部 件 的 位 置 . 第 一 个 元 素 为 坐标 轴 位 置 到 
坐标 轴 标 签 的 有 距离 ,以 文本 行 高 为 单位 . 第 二 个 元 素 为 坐标 轴 位 置 到 
坐标 刻度 标签 的 距离 . 第 三 个 元 素 为 坐标 轴 位 置 到 实际 画 的 坐标 轴 
的 距离 ,通常 为 0. 
tck=0.01 坐标 轴 刻 度 线 长 度 ,单位 是 绘图 区 域 大 小 , 值 为 占 绘图 区 
域 的 比例 .tck 小 于 0.5 时 ,x 轴 和 y 轴 的 刻度 线 将 统一 到 相同 的 长 
E. 取 1 时 即 画 格 子 线 , 取 负 值 时 刻度 线 画 在 区 域 的 外 面 . 
xaxs=“s”,yaxs=“d” 控制 x 轴 和 7y 轴 的 画 轴 方法 . 
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PAARA “s” (BH standard) 或 “e”( 即 extend) 时 ,数据 范围 控制 在 最 小 刻 
度 和 最 大 刻度 之 间 . 取 “e” 时 ,如 果 有 数据 点 十 分 靠近 边缘 , 轴 的 范围 会 略微 
扩大 . 这 种 画 轴 方式 有 时 会 在 轴 的 一 边 留 下 太 大 的 空白 . 

取 值 为 “i”( 即 intemal) 或 “r”( 此 为 默认 值 ) ,将 使 刻度 线 都 落 在 数据 范 
国内 部 ,而 “方式 所 留 的 边 空 较 小 . 取 值 设 为 “d" 时 会 锁定 此 坐标 轴 , 后 续 的 
图 形 都 使 用 与 它 完全 一 样 的 坐标 轴 ,这 在 要 生成 一 系列 可 比较 的 图 形 时 是 有 
用 的 . 要 解除 锁定 ,需要 把 这 个 图 形 参数 设 为 其 他 值 . 

(i) AEAF 

R 中 一 个 单独 的 图 由 绘图 区 域 和 包围 绘图 区 域 的 边 空 组 成 . 边 空中 可 以 
包含 坐标 轴 标 签 、 坐 标 轴 刻 度 标签 ,标题 .小 标题 等 ,绘图 区 域 一 般 被 坐标 轴 包 
围 , 见 图 2-16. 





maif3] 





2-16 图 形 边 空 


边 空 的 大 小 由 参数 mai 或 mar 控制 . 它们 都 是 包含 4 个 元 素 的 向 量 ,分 
别 规定 下 方 、 左 方 、 上 方 、 右 方 的 边 空 大 小 ,其 中 mai 取 值 的 单位 是 英寸 ,而 
mar 的 取 值 单位 是 文本 行 高 度 . 例如 : 

>par( mai=c(2,2,1,0.2)) 

>par(mar=c(4,2,2,1)) 
这 两 个 图 形 参数 不 是 独立 的 , 设 定 一 个 会 影响 另 一 个 . R 中 默认 的 图 形 边 空 
常常 太 大 ,以 至 于 有 时 图 形 窗口 较 小 时 边 空 占 了 整个 图 形 的 很 大 一 部 分 . 通 
常 我 们 可 以 取消 右边 空 ,并 且 在 不 用 标题 时 可 以 大 大 缩小 上 边 空 . 例如 ,下 例 
可 以 生成 十 分 紧凑 的 图 形 : 

>oldpar=par(mar=c(2,2,1,0.2)) 
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>plot(x,y) 

在 一 个 页 面 上 夯 多 个 图 时 边 空 自动 减 半 , 但 往往 还 需要 进一步 减 小 边 空 
才能 使 多 个 图 有 意义 . 

(这 ) 一 页 多 图 


R 还 可 以 在 同一 页 面 开 若干 个 按 行 、 列 排列 的 窗 格 ,在 每 个 窗 格 中 可 以 作 
一 幅 图 .每 个 图 有 自己 的 边 空 ,而 所 有 图 的 外 面 都 可 以 包 一 个 “外 边 空 ”, 见 图 


2-17. 
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图 2-17 一 页 多 图 


一 页 多 图 用 参数 mfrow 或 mfcol 规定 ,例如 : 

>par( mfrow =c(3,2)) 
表示 同一 页 有 3 行 2 列 , 共 6 个 图 ,而 且 次 序 为 按 行 填 放 . 类似 地 ， 

>par( mfcol=c(3,2)) 
规定 相同 的 窗 格 结构 ,但 是 次 序 为 按 列 填 放 , 即 先 填 满 第 一 列 的 3 个 ,再 填 第 
二 列 . 要 取消 一 页 多 图 只 要 再 运行 : 

> par( mfrow=c(1,1)) 
即 可 . i 
默认 时 无 外 边 空 .为 了 规定 外 边 空 大 小 ,可 以 在 par( ) 中 使 用 参数 omi 或 
oma. omi 以 英寸 为 单位 ,oma 以 文本 行 高 为 单位 . 两 个 参数 均 为 包含 4 个 元 素 
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的 向 量 ,分 别 给 出 下 、 左 、 上 、 右 方 的 边 空 大 小 . 例如: 

> par(oma=c(3,3,2,3)) 

函数 mtext( ) 用 来 在 左边 空中 加 文本 标注 . 其 用 法 为 

mtext( text , side =3 , line =0, outer=FALSE) 
其 中 text 为 要 加 的 文本 内 容 ,side 表示 在 哪 一 边 写 (1 为 下 ,2 为 左 ,3 为 上 ,4 
HA), line 表示 边 空 从 里 向 外 数 的 第 几 行 (最 里 面 的 一 行 是 第 0 行 )，outer= 
FALSE 时 使 用 外 边 空 ,否则 会 使 用 当前 图 的 边 空 . 例如 : 

>par( mfrow=c(2,2) ,oma=c(0,0,3,0) ,mar=c(2,1,1,0.1)) 

>plot(x) ;plot(y) ;boxplot (list(x=x,y=y) ) ;plot(x,y) 

> mtext( " Simulation Data" ,outer=T,cex=1.5) 

在 多 图 环境 中 还 可 以 用 mfg 来 直接 跳 到 某 一 个 窗 格 ,比如 : 

>par( mfg=c(2,2,3,2)) 
表示 在 3 行 2 列 的 多 图 环境 中 直接 跳 到 第 二 行 第 二 列 位 置 . mfg 中 的 后 两 个 
数 表示 多 图 环境 的 行 、 列 数 , 前 两 个 数 表示 要 跳 的 位 置 . 

可 以 不 使 用 多 图 环境 而 直接 在 页 面 中 的 任意 位 置 产 生 一 个 窗 格 来 绘图 ， 
参数 为 fig, 例如 : 

> par(fig=c(4,9,1,4)/10) 
此 参数 为 一 个 向 量 , 分 别 给 出 窗 格 的 左 、 右 、 下 、 上 边缘 的 位 置 , 取 值 为 占 全 页 
面 的 比例 ,比如 上 面 的 例子 中 ,在 页 面 的 右 下 方 开 一 个 窗 格 作 图 . 

8. 图 形 设备 

R 中 作 的 图 支持 各 种 图 形 设备 ,其 中 常用 的 是 显示 器 和 PostSeript 打印 
机 . 在 一 个 运行 期 间 可 以 有 多 个 图 形 设备 同时 存在 .在 R 中 ,用 

xll() 
打开 图 形 窗口 绘图 . 再 次 调用 这 样 的 函数 将 打开 第 二 个 图 形 窗口 . 用 


dev. list( ) 
可 显示 已 打开 的 图 形 设备 列表 . 要 关闭 一 个 图 形 设 备 ,用 
dev. off( ) 


这 可 以 使 得 图 形 得 以 完成 ,例如 ,对 于 PostScript 设备 ,关闭 设备 时 可 完成 打印 
或 存盘 . 用 graphics. off( ) 函数 可 以 关闭 所 有 打开 的 图 形 设备 . 

MS Windows 下 的 R 可 以 把 显示 窗口 中 的 图 形 复制 到 剪贴 板 或 保存 为 各 种 
格式 的 图 形 文 件 , 包 括 WMF、PostScript、.PDF .PNG 、BMP 以 及 JPEG. 这 样 可 以 用 
R 生成 所 需 的 图 形 ,然后 存 为 需要 的 格式 . 如 果 用 MS Word 排版 , 则 可 以 把 屏幕 
图 形 存 为 WMF 等 格式 .生成 PostScript 文件 的 设备 可 以 用 如 下 函数 打开 : 

>PostScript (file=" result. ps" ,horizontal = FALSE ,width = 5 ,height=3) 
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这 时 用 图 形 命令 生成 一 个 页 面 的 图 形 ,然后 用 dev. off ( ) 关闭 设备 , 则 可 
生成 文件 result. ps( ) . PostSceript( ) 函数 中 的 horizontal 参数 指定 是 否 将 图 旋转 
90 JE ,使 得 x 轴 平 行 于 纸 的 长 度 ，width 和 height 规定 图 的 宽 和 高 ,单位 是 英 
TO 英寸 等 于 2.54 厘米 ). 

在 打开 了 多 个 图 形 设备 后 ,可 以 用 dev. set ( ) 函数 来 选择 当前 设备 . 
dev. next( ) 和 dev. prev( ) 分 别 返 回 下 一 个 和 上 一 个 图 形 设备 . 

9. 极 坐标 图 形 的 绘制 

R 绘 制 极 坐标 图 形 的 命令 是 polar. plot (r, 0). 例如 绘制 r = 





图 2-18 r=2cos(2( 0- 吝 ) ) 的 图 形 


2.10 解 方程 


在 求解 极 大 似 然 方程 时 ,有 时 很 难 直接 得 到 其 显 式 解 ,需要 用 数值 方法 . 
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因此 在 本 节 中 我 们 对 用 R 求解 方程 进行 介绍 . 

1. 求 一 元 多 项 式 的 根 

设 一 元 多 项 式 为 

f(x)=a, taxt +a, x) + a,x". 

A R + E sk BR BJ 8 PF 38 

>a=ec(a,,a,,` ,a,) ;polyroot(a) 

例如 , 求 函数 /x) = 32 +x-4 的 根 . 

令 a=c(-4,1,0,3), 并 运行 polyroot(a) 得 到 此 函数 的 3 个 根 分 别 为 1， 
-0.5+1.040833i,—-0.5-1.040833i. 

2. 求 一 元 非 线性 方程 的 解 

假设 方程 为 (x) = 0. 如 果 要 求 它 的 解 ,但 又 不 知 其 解 的 范围 ,那么 可 先 
ii H PS 28 f(x) 的 曲线 图 ,观察 自 变 量 x 的 取 值 范 围 ,再 利用 R 程序 uniroot( ) 
得 到 其 解 . 

例如 , 求 方程 


+a -6) - 20(1 - 0)° -26 +20(1-80)=0, Ə e [0,1] 
的 解 . 
+ f(0)=(1-0)'-20(1- 6) - 0 +20(1- 0), HSO) 的 图 ， 


见 图 2-19. 从 图 2-19 中 可 看 出 , f(9) 有 3 个 根 ,它们 分 别 位 于 (0.2,0.3), 
(0.4,0.6), (0.7,0.9) 之 间 . 直接 运行 uniroot(f,c(0.2,0.3))，,uniroot(f， 
c(0.4,0.6)),uniroot(f,c(0.7,0.9)) 得 到 3 个 根 分 别 为 0.211,0.5 ,0.789. 

或 者 先 加 载 包 library( rootSolve) ,然后 运行 uniroot. all(f,c(0,1)) 可 以 得 
#J/(0) 在 区 间 (0,1) 内 的 以 上 3 个 根 . 

3. 求 非 线性 方程 组 的 解 

例如 , 设 非 线性 方程 组 为 


全 +y = 1, 
y = 2x. 
求 上 述 非 线性 方程 组 的 解 . 运行 下 述 程序 : 
>model=function(x) {c(Fl=x[1] +x[2]’-1,F2=x[2]’-2*x[1])|}# 定 
义 方程 
>library( rootSolve )# 加 载 rootSolve 包 
>multiroot( model,c(1,1)) 
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1 


0.4 


0.2 
一 
£ 0.0 
-0.2 
-0.4 
0.0 0.2 0.4 0.6 
6 
图 2-19 6) 的 曲线 图 
$ root 
[1] 0.4142136 0.9101797 
$ f. root 
F1 F2 
6.43565e-10 6.39019e-10 
$ iter 
[1] 5 


$ estim. precis 

[1] 6.43565e-10 

得 到 解 x = 0. 4142, y = 0. 9102. 

注 :选择 的 初始 值 必须 使 Jacobi 行列 式 不 为 零 . 


4. 微 商 的 计算 

例如 ,已 知 y =log(z + y1 +<), Ry, y". 
首先 ,定义 函数 : 

>y= expression( log( x+sqrt( 1+x°2) ) ) 

>deriv( y," x") ÆR y £ + x 的 一 阶 导 


expression ( Í 


1.0 


i 2E R 介 # e 
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. expr2 <- 1 + x "2 
. expr4 <- x + sqrt(. expr2 ) 
. value <- log(. expr4 ) 
.grad <— array (0, c(length(. value), 1L), Hst( NULL, e("x"))) 
.grad[ , "x" ] <- (1 + 0.5 * (2 * x * .expr2^ -0.5))/.expr4 
attr(. value, " gradient" ) <—. grad 
. value 
l) 
其 中 .grad[ , "x" ] <-(1 + 0.5 * (2 * x * .expr2^ -0.5))/. expr4 即 
为 了 ,再 运行 deriv3(y,"x" ) 得 到 
expression( | 
. expr2 <- 1 + x" 2 
. expr4 <- x + sqrt(. expr2 ) 
.expr6 < 一 2 * x 
. expr7 <- . expr2^ -0. 5 
.exprl0 <- 1 + 0.5 * (.expr6 * .expr7) 
. value <- log(. expr4 ) 
. grad <- array(0, c(length(. value), IL), list( NULL, e("x"))) 
. hessian <— array(0, c(length(. value), 1L, 1L), Hst( NULL, 
e("x"), e("x"))) 
.grad[ , "x" ] <- . expr10/. expr4 
. hessian[ , "x" ,"x"] <- 0.5 * (2 * .expr7 + .expr6 * (-0.5 * 
(. expr6 * .expr2" -1.5)))/.expr4 — .exprl0 * .exprl0/. ex- 
pr4 2 
attr( . value, " gradient" ) <- . grad 
attr( . value, " hessian" ) <- . hessian 
. value 
l) 
其 中 hessian[ , "x","x"]<- 0.5 * (2 *. expr? + . expr6 * ( -0.5 * 
(. expr6 * . expr2^ —1. 5) ) )/. expr4 — . expr10 * . exprl0/. expr4" 2 即 表 示 所 求 
的 7“ 
用 有 不仅 可 以 计算 函数 的 极限 、 积 分 表达 式 , 还 可 以 解决 优化 问题 ,但 这 不 
是 本 书 的 目的 ,所 以 不 作 详细 介绍 . 有 兴趣 的 读者 可 以 参考 R 的 “帮助 "文件 . 
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练 习 2 


1. 如 何 安装 R 软件 ?如何 下 载 和 安装 极 坐标 软件 包 plotrix? 
2. 如 何 调用 并 读 取 C: 中 的 data. txt 文件 ? 如 何 读 取 Excel 数据 ? 
3.R 中 的 向 量 默认 时 是 行 向 量 还 是 列 向 量 ? 在 矩阵 中 byrow = TRUE 是 什 
么 含义 ? 什么 叫 对 象 ? 
4. # R 的 列表 中 元 素 的 长 度 必 须 一 样 吗 ? R 的 列表 有 维 数 吗 ? 数据 框 
有 维 数 吗 ? . 
5. 如 何 产生 三 阶 单位 矩阵 ? 如 何 求 矩阵 的 逆 和 矩阵 的 转 置 ? 
6. 解释 函数 legend( ) 的 作用 ,各 参数 代表 什么 含义 ? 
7. 如 何 求解 微分 方程 y + 3y - e =x, B y(0) = 1. 
8. 假设 有 2008 年 x X 市 住房 销售 数据 如 下 : 
月 份 ”总 套数 90m 以 下 90~120m? 120 ~140mz 140m? 以 上 


08.1 3517 726 1117 1042 632 
08.2 1428 272 463 432 261 
08.3 3659 940 1213 989 517 
08.4 2957 800 944 750 462 
08.5 4516 1194 1439 1261 667 
08.6 4382 1229 1418 1140 595 
08.7 4258 1129 1392 1164 573 
08.8 2941 808 972 749 411 
08.9 2318 682 746 557 334 
08.10 3278 1025 1096 726 430 
08.11 4253 1278 1385 986 604 
08.12 4027 1088 1355 1043 541 


并 将 上 述 图 设置 不 同 颜色 ,再 将 各 类 住房 的 上 述 图 形 分 别 画 在 不 同 的 页 面 上 . 
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调用 R 函数 可 以 完成 基本 的 统计 分 析 . 下 面 介绍 如 何 用 R 进行 描述 统 
计 、 探 索性 数据 分 析 、 分 布 研究 和 常见 的 假设 检验 ,还 可 以 求 置 信 区 间 ， 


3.1 单 变 量 数 据 分 析 


对 存放 在 向 量 或 数据 框 中 的 变量 可 以 用 smmary( ) 函数 来 计算 几 个 描述 
性 统计 量 . 例如 : 
>cl =read. table( " c :/simR/class. txt" , 
+ col. names =c( “ Name" ," Sex" ," Age" ," Height" ," Weight" ) ) 


>summary( c1) 


Name Sex Age Height Weight 

车 丰 : 1 F:9 Min. :12.00 Min. :142.0 Min. :40 
陈胜 : 1 M:10 lst Qu.:12.00 Ist Qu. :147.0 Ist Qu. :43 
陈 凯 : 1 Median :13.00 Median :149.0 Median :48 
陈 美 玲 : 1 Mean :12. 95 Mean :148.5 Mean :47 
胡 进 : 1 3rd Qu. :13.50 3rd Qu. :150.5 3rd Qu. :50 
胡 敏 : 1 ~ Max. :14.00 Max. :155.0 Max. :58 
(Other) :13 


对 数值 型 变量 计算 了 平均 值 、 最 大 值 、 最 小 值 、 中 位 数 、 四 分 之 一 和 四 分 之 三 分 
位 数 ,对 因子 计算 了 频数 统计 . 

对 数值 型 变量 x 也 可 以 用 mean ,sd,var,median ,min ,max 等 函数 来 计算 其 
简单 统计 量 . 可 以 用 stem(x) 绘 制 x 的 茎 叶 图 ,用 hist(x) 画 直方 图 ,用 boxplot 
(x) 画 盒 形 图 ,用 qqnorm(x) 和 qqline(x) 画 正 态 Q-Q 图 . 

为 了 估计 数值 型 变量 的 分 布 密度 ,除了 用 hist( ) 画 直方 图 外 ,还 可 以 用 
density ( ) 函数 进行 非 参数 密度 估计 .例如 : 


>attach( c1) 
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>plot( density( Height) , main = "Heightdensity" ) 
结果 见 图 3-1. 还 可 以 设法 把 核 密度 曲线 加 到 直方 图 上 ,例如 : 


Height density 





140 145 150 155 
N=19 Bandwidth=1.305 


图 3-1 核 密度 曲线 


>hl =hist( Height, prob=T, plot =T) $ density 
>h2 = density ( Height) 
>hist( Height, prob =T ,ylim=range(hl,h2 $ y)) 
>lines( h2) 
结果 见 图 3-2. 


Histogram of Height 
0.15 
0.10 
号 
A 0.05 
0.00 
mT 
142 146 150 154 


Height 
图 3-2 身高 直方 图 与 核 密度 估计 曲线 


对 因子 (分 类 变量 )f 可 以 用 table(f) 统计 其 频数 分 布 ,用 plot( f) 画 其 频数 
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分 布 图 . 例如 : 
>table( Sex) 
Sex 
FM 
9 10 


3.2 假设 检验 


R 中 的 stats 程序 包 (package) 提供 了 常见 的 假设 检验 功能 . stats 包 默 认 时 
自动 调 入 . 
为 了 检验 正 态 性 ,只 要 调用 shapiro. test ( ) 函数 就 可 以 做 Shapiro-Wilk 检 
验 : 
>shapiro. test( Height) 
Shapiro-Wilk normality test 
data: Height 
W = 0.9496, p-value = 0.3888 
可 见 身 高 数据 的 正 态 性 很 好 . 
函数 t. test( ) 可 以 进行 单 总 体 的 上 检验、 两 独立 总 体 的 上 检验 和 成 对 上 检 
验 .例如 ,下 面 的 程序 检验 身高 均值 是 否 为 148.5: 
| >t.test( Height, mu=148.5) 
One Sample t-test 
data: Height 
t = 0.034, df = 18, p-value = 0.9732 
alternative hypothesis: true mean is not equal to 148.5 
95 percent confidence interval: 
146. 9008 150.1518 
sample estimates: 
mean oÍ x 
148. 5263 
默认 时 进行 的 是 双 侧 检验 . 为 了 进行 单 侧 检 验 ,可 以 指定 alternative = “ grea- 
ter” 或 “less”. 例如 : 
>t. test( Height, mu = 148. 5 , alternative = " less" ) 
One Sample t-test 
data: Height 
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t = 0.034, df = 18, p-value = 0.5134 
alternative hypothesis: true mean is less than to 148. 5 
95 percent confidence interval: 
-Inf 149. 868 
sample estimates : 
mean of x 
148. 5263 
对 于 用 分 组 变量 表示 的 两 个 独立 组 ,可 以 用 ttest( 分 析 变 量 ~ 分 组 变 
FE) 的 调用 形式 进行 独立 两 组 的 上 检验 . 例如 : 
>t. test( Height ~ Sex) 
Welch Two Sample t-test 
data; Height by Sex 
t = -2.1811, df = 14.832, p-value = 0.0457 
alternative hypothesis: true difference in means is not equal to 0 
95 percent confidence interval: 
-6. 15437234 —0. 06784988 
sample estimates: 
mean in group F mean in group M 
146. 8889 150. 0000 
注意 ,上 面 用 的 是 不 需要 假定 两 组 方差 相等 的 Welch 检验 . 如 果 假 定 两 . 
组 方差 相等 , 则 可 以 在 函数 调用 中 增加 参数 var. equal = TRUE. 如 果 两 个 独立 
组 放 在 两 个 变量 xl 和 x2 中 , 则 可 以 直接 用 +. test(xl ,x2) 进行 比较 . 
用 wilcox. test( 分 析 变 量 ~ 分 组 变量 ) 或 wilcox. test(xl ,x2) 可 以 进行 独立 
两 组 的 Wilcoxon 秩 和 检验 . 
对 于 配对 观测 的 变量 x 和 yy, 比较 时 只 需 用 +. test(x,y,paired = True). 用 
wilcox. test( x,y,paired=True) 可 以 进行 Wilcoxon 秩 和 检验 . 


3.3 R 统 计 模 型 简介 


R 中 实现 了 几乎 所 有 常见 的 统计 模型 ,而 且 多 种 模型 可 以 用 一 种 统一 的 
观点 表示 和 处 理 . 本 节 只 介绍 用 R 对 模型 作 分 析 , 而 不 介绍 模型 的 原理 . 
1. 统计 模型 的 表示 
很 多 统计 模型 可 以 用 一 个 线性 模型 来 表示 : 
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iid. 


P - 
y = È Bryte, e ^ N(0,0), i=1,,n, 
j=0 


写 出 矩阵 形式 为 


y = X + e. 


其 中 7 为 因 变量 , X 为 模型 矩阵 或 称 设计 挎 阵 ,各 列 为 xz,…，,z， 等 自 变量 ， 
xo 中 的 所 有 元 素 为 1 ,确定 此 模型 的 截 距 项 . 


在 有 中 ,模型 是 一 种 对 象 ,其 表达 形式 称 为 一 个 公式 (formula). 下 面 先 举 


几 个 例子 .假定 y,x,x0,xl,… 是 数值 型 变量 ,X 是 矩阵 ,A ,B,C,… 是 因子 . 


y~x,y~1+x 两 个 式 子 都 表示 y 对 x 的 简单 一 元 线性 回归 . 第 一 个 
式 子 带 有 隐 舍 的 截 距 项 ,而 第 二 个 式 子 把 截 蝶 项 显 式 地 写 出 来 了 . 
log(y) ~xl+x2 表示 log(y) 对 xl 和 x2 的 二 元 回归 , 带 有 隐 舍 的 截 距 
项 . 

y 了 ~ploy(x,2),y~1+x+I(x2) ”表示 yy 对 x 的 一 元 二 次 多 项 式 回归 . 
第 一 种 形式 使 用 正 交 多 项 式 ,第 二 种 形式 直接 使 用 x HEARR. 

y~A 单 因素 方差 分 析 , 指 标 为 y, 分 组 因素 为 A. 

y~A+x 单 因 素 的 协 方差 分 析 ,指标 为 y, 分 组 因素 为 A, 协 变量 为 x. 
y~A*B,y~A+B+A:B,y~A% in %B,y~A/B 非 可 加 两 因素 方差 
分 析 ,指标 为 y, 分 组 因素 为 A,B. 前 两 个 公式 表示 相同 的 交叉 分 类 设 
计 ,后 两 个 公式 表示 相同 的 峙 套 分 类 设计 . 

y-(A+B+C)2,y-A *B*C-A:B:C 表示 三 因素 试验 ,只 考虑 两 两 
交互 作用 而 不 考虑 三 因素 的 交互 作用 . 两 个 公式 是 等 价 的 . 

y~A*x,y ~A/x,y ~A/(x+1)-1 都 表示 对 因子 A 的 每 一 水 平 拟 合 
y 对 x 的 线性 回归 ,但 三 个 公式 的 编码 方式 不 同 . 最 后 一 种 形式 对 A 
的 每 一 水 平 都 分 别 估计 截 距 和 斜率 项 . 

y~A*B+Error(C) 表示 有 两 个 处 理 因 素 A 和 B ,误差 分 层 由 因素 C 
确定 的 设计 . 


在 R 中 ,~ 运算 符 用 来 定义 模型 公式 . 一 般 的 线性 模型 公式 为 


因 变 量 ~ 第 一 项 [+] 第 二 项 [+] 第 三 项 [ 土 ]… 


其 中 因 变量 可 以 是 向 量 或 矩阵 ,或 者 结果 为 向 量 或 矩阵 的 表达 式 . [+] 是 加 
号 + 或 者 减 号 - ,表示 在 模型 中 加 人 一 项 或 去 掉 一 项 .第 一 项 前 面 若是 加 号 , 则 
可 以 省 略 . 
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一 个 值 为 向 量 或 矩阵 的 表达 式 R 1. 
一 个 因子 . 
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。 一 个 “公式 表达 式 ” ,由 因子 、 向 量 和 算 阵 通过 “公式 运算 符 ” 连 接 而 
E. 

每 一 项 都 定义 了 要 加 入 模型 矩阵 或 从 模型 矩阵 中 剔除 的 若干 列 . 1 表示 
一 个 截 距 项 列 ,除非 显 式 地 删除 ,否则 总 是 隐 含 地 包括 在 模型 公式 中 . 下 面 列 
出 了 各 运算 符 的 简要 说 明 . 

° y-M 7y 作 为 因 变 量 , 由 M 解释 . 

° MI+M2 加 入 M1 和 M2. 
M1-M2 加 入 M1 但 去 掉 M2 指定 的 项 . 
M1:M2 为 MI 和 M2 的 张 量 积 .如果 两 项 都 为 因子 , 则 为 因子 的 交互 
作用 . 
Ml % in% M2 与 M1:M2 类 似 但 模型 矩阵 编码 方式 不 同 . 
M1 * M2 等 于 Ml+M2+M1:M2. 
Mn M 中 所 有 各 项 以 及 所 有 到 n 阶 为 止 的 交互 作用 . 
IM) 将 M 隔离 ,使 得 M 中 的 运算 符 按照 原来 的 算术 运算 符 解 释 而 
不 是 按 公式 元 素 符 解 释 . REA M 的 结果 作为 公式 的 一 项 . 

注意 ,在 函数 调用 的 括号 内 的 表达 式 按 普通 四 则 运算 解释 . 函数 1( ) 可 
以 把 一 个 计算 公式 封装 起 来 作为 模型 的 一 项 使 用 . R 的 模型 表示 只 给 出 了 因 
变量 和 自 变量 以 及 自 变量 间 的 关系 ,这 样 只 确定 了 线性 模型 的 模型 矩阵 ,而 模 
型 参数 向 量 是 隐 含 的 ,并 没有 在 模型 公式 中 体现 出 来 . 这 种 做 法 使 用 于 线性 
模型 ,但 不 具有 普遍 性 ,例如 非 线 性 模型 就 不 能 这 样 表示 . 

2. 线性 回归 模型 

拟 合 普通 的 线性 模型 的 函数 为 Im( ) ,其 简单 的 用 法 为 

>fitted. model = lmi ( formula , data = data. frame ) 
其 中 ,data. frame 为 各 变量 所 在 的 数据 框 , formula 为 模型 公式 ,fitted. model 是 
线性 模型 拟 合 结果 对 象 (其 class 属性 为 Im). 例如 : 


> attach(c1) 


> modell =lm( Weight ~ Height+Age ,data=cl. frame) 

> modell 
可 以 拟 合 一 个 Weight 对 Height 和 Age 的 二 元 回归 ( 带 有 隐 舍 的 截 距 项 ) ,数据 
来 自 数据 框 cl. 拟 合 的 结果 存 人 到 对 象 modell H. 注意 ,不 论 数 据 框 cl AES 
已 用 attach( ) 连接 到 当前 运行 环境 ,都 可 被 Im( ) 使 用 . Im( ) 的 基本 显示 十 分 
简练 : 

Call; 

lm(formula = Weight ~ Height + Age, data = cl.frame) 
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Coefficients : 
( Intercept) Height Age 
-141.224 3.597 1.278 


3. 提取 信息 的 通用 函数 


lm( ) 函数 的 返回 值 称 为 模型 拟 合 结果 对 象 ,本 质 上 是 一 个 具有 类 属性 值 
lm 的 列表 ,有 model, coefficients „residuals 等 成 员 . 为 了 获得 更 多 的 拟 合 信息 ， 
可 用 对 lm 类 对 象 有 特殊 操作 的 通用 函数 . 这 些 函 数 有 :add1l ( ) ,coeff( ) ， 
effects( ) ,kappa( ), predict( ) residuals( ) alias( ) deviance( ) ,family( ) ， 
labels( ) ，print( ) ，summary( ) ,anova( ) ,dropl( ) ,formula( ) ,plot( ) ,proj( ). 
例如 : > predict( modell ) 
> family(modell ) 
下 面 列 出 了 lm 类 ( 拟 合 模型 类 ) 常 用 的 通用 函数 的 简单 说 明 ， 
° anova( 对象 1 ,对象 2) ”把 一 个 子 模型 与 原 模型 比较 ,生成 方差 分 析 
表 . 
coefficients( 对 象 ) ”返回 回归 系数 (矩阵 ) ,可 简写 为 coef( 对象) . 
deviance( 对 象 ) 返回 残 差 平方 和 ,车 有 权重 , 则 加 权 . 
formula( 对 象 ) 返回 模型 公式 . 
plot( 对象) ”绘制 模型 的 几 种 图 ,如 残 差 对 预测 值 图 . 
predict( 对 象 ,newdata = 数据 框 ) ,predict. gam( 对 象 ,newdata = 数据 框 ) 
有 了 模型 拟 合 结果 以 后 对 新 数据 进行 预报 . 指定 的 新 数据 必须 
与 建 模 时 用 的 数据 具有 相同 的 变量 结构 ， 函 数 结果 为 对 数据 框 中 每 
一 观测 的 因 变量 的 预报 结果 (为 向 量 或 矩阵 ). 
predict. gam( ) 与 predet ( ) 相同 但 适应 性 更 广 ,可 应 用 于 lm, glm 
和 gam 的 拟 合 结果 . 比如 , 当 多 项 式 基 函数 用 了 正 交 多 项 式 时 ,加 和 新 
PC 8 2 SP 5k IF 2 £ TJ zÑ E pR 2k Pk , JH predict. gam ( ) 可 以 避免 由 此 
引起 的 偏差 . 
print( 对 象 ) ”简单 显示 模型 拟 合 结果 . 一 般 不 用 print( ) ,而 是 直接 
键 人 对 象 名 来 显示 . 
residuals( 对象) ”返回 模型 残 差 (矩阵 ) , 若 有 权重 , 则 适当 加 权 . 可 
简写 为 resid( ) . 
* summary( 对 象 ) ”可 显示 较 详细 的 模型 拟 合 结果 . 
4. 方差 分 析 
方差 分 析 经 常用 于 研究 取 离散 值 的 因素 对 一 个 数值 型 指标 的 影响 . R 中 
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进行 方差 分 析 的 函数 是 aov( ) ,格式 为 aov( 公 式 ,data= 数 据 框 ) ,用 法 与 Im() 
类 似 , 提 取信 息 的 各 通用 函数 仍 有 效 . 

假设 有 不 同 品牌 的 木板 磨损 比较 的 数据 保存 在 “c:/simR/veneer. tex” 
中 .如 : 


>c2 =read. table("c:/simR/veneer. txt" ,col. names=c("Brand" ," Wear" ) ) ;c2 


Brand Wear Brand Wear 
1 ACME 2.3 11 AJAX 1.9 
2 ACME 2.1 12 AJAX 2.1 
3 ACME 2.4 13 TUFF 2.4 
4 ACME 2.5 14 TUFF 2.7 
5 CHAMP 2.2 15 TUFF 2.6 
6 CHAMP 2.3 16 TUFF 2.7 
7 CHAMP 2.4 17 TUFF 2.3 
8 CHAMP 2.6 18 TUFF 2.5 
9 AJAX 2.2 19 TUFF 2.3 
10 AJAX 2.0 20 TUFF 2.4 


首先 把 每 个 品牌 木板 的 磨损 情况 画 盒 形 图 并 且 放 在 同一 页 面 中 ,函数 如 

F: I l 
> plot( Wear Brand ,data = c2 ) 

结果 见 图 3-3. 这 种 图 可 以 直观 地 比较 一 个 变量 在 多 个 组 的 分 布 ,或 者 比较 几 

个 类 似 的 变量 . 从 图 中 可 以 看 出 ,AJAX 的 较 好 ,TUFFY 的 较 差 ,其 他 两 个 品牌 

差别 不 显著 . 


Wear 





ACME AJAX TUFF 
Brand 


3-3 各 品牌 磨损 的 箱 型 图 
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为 了 检验 品牌 这 个 因素 对 指标 磨损 量 有 无 显著 影响 ,调用 函数 aov( ) : 
> aov.c2=aov( Wear ~ Brand,data=c2) 
> summary( aov. c2) 
Df Sum Sq Mean Sq F value Pr( >F) 
Brand 3 0.51575 0.17192 6.6481 0. 003998 ** 
Residuals 16 0.41375 0.02586 


Signif. codes; 0'*”” 0.001 0.01’*’ 0.05” 0.1'' 1 
可 见 品牌 因素 是 有 显著 差异 的 . 


3.4 回归 分 析 实 例 


下 面 以 “ce:/simRveclass. txt” 的 数据 为 例 进行 分 析 . 我 们 希望 理解 体重 、 身 
高 ,年龄 和 性 别 等 变量 的 基本 情况 以 及 相互 关系 . 


1. 数据 输入 
假设 数据 放 在 文本 文件 “c:/simR/elass. txt” 中 ,没有 列 标题 ,各 变量 上 下 
对 齐 . 先 把 数据 读 人 一 个 R 数据 框 对 象 中 : 


> cl=read. table("c:/simR/class. txt" ， 


+ col. names=c("Name" ," Sex" ," Age" ," Height" ," Weight" ) ， 
+ row. names = " Name" ) 
> c1 
Sex Age Height Weight 
李 丽 F 13 148 41 
王菲 F 13 150 45 
# 38 F 14 151 44 
z F 14 149 43 
马莉 F 12 143 40 
胡 进 M 14 153 55 
车 丰 M 14 155. 58 
王建 军 M 12 149 52 
汪 平 M 12 148 48 
2. 探索 性 数据 分 析 


若 要 研究 各 变量 的 分 布 情况 ,看 是 否 接近 正 态 ,有 无 明显 的 异常 值 , 有 没 
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有 明显 的 序列 关系 ,等 等 ,那么 我 们 可 定义 函数 来 画 出 常见 的 探索 性 数据 分 析 
图 形 ,给 出 一 种 直观 上 的 了 解 . 对 连续 型 变量 可 以 画 直 方 图 、 箱 型 图 分 布 密度 
估计 图 和 正 态 概率 图 ; 对 离散 型 变量 只 要 画 其 分 布 频数 条 形 图 即 可 ,分 布 频 
数 用 table( ) 函数 计算 . 研究 序列 相关 性 ,可 以 作 时 间 序 列 图 和 自 相 关 函 数 图 . 
因为 这 些 图 经 常 重 复 使 用 ,我 们 定义 函数 eda. shape( ) 和 eda. ts( ) ,将 上 述 分 
析 图 形 在 同一 页 面 画 出 ,用 以 探讨 各 数值 型 变量 的 分 布 情况 . 
eda. shape = function( x) Í 
oldpar=par( mfcol=c(2,2), 
mar=c(2,2,0.2,0.2) ,mgp=c(1.2,0.2,0)) 


hist(x,main="" ,xlab="" ,ylab="") 

plot( density(x) ,xlab="x" ,ylab="" ,main="") 
boxplot( x) 

qqnorm(x,main="" ,xlab="" ,ylab="") 
qqline( x) 

par( oldpar) 


invisible( ) 
} 
eda. ts = function ( x) | 
oldpar= par( mfcol =c(2,1), 
mar=c(2,2,1,0.2) ,mgp=c(1.2,0.2,0)) 


plot. ts( x ,Xlab =" x" > main = "nn ) 
acf( x ,Xlab =" x" ,main ="ww ) 
par( oldpar) 


invisible( ) 
l 
函数 中 最 后 的 invisible( ) 表 示 在 命令 行 调用 此 函数 时 不 要 显示 任何 返回 
值 . 函数 density( ) 用 来 作 核 密度 曲线 估计 . 接着 把 数据 框 el 连接 人 当前 的 搜 
索 路 径 中 ,以 便 直接 使 用 cl 中 的 变量 名 . 利用 下 述 命 令 画 出 图 3-4 和 图 3-5. 
>attach( cl) 
>eda. shape( Height) 
>eda. ts( Height) 
从 图 3-4 可 以 看 出 ,身高 的 分 布 接近 正 态 分 布 且 无 明显 的 异常 点 . 
因为 数据 是 不 同 个 体 的 观测 ,不 可 能 有 序列 关系 ,所 以 没 必 要 画 出 身高 的 
时 间 序 列 图 . 为 了 研究 数值 型 变量 Weight, Height 和 Age 间 的 关系 ,我 们 用 
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图 3-4 身高 的 描述 性 统计 图 
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图 3-5 身高 的 折线 图 及 自 相 关 图 


pairs( cbind( Height, Weight, Age) ) 画 出 其 散 点 图 阵 ( 图 3-6). 从 散 点 图 矩阵 可 
以 看 出 ,三 个 变量 之 间 都 可 能 有 线性 相关 关系 . ` 

为 了 研究 因子 Sex 对 其 他 变量 的 影响 ,可 以 画 Sex 在 不 同 水 平 上 各 变量 
的 箱 型 图 ,程序 如 下 : 

> oldpar=par( mfcol=e(1,3)) 
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图 3-6 身高 .体重 和 年 龄 的 散 点 图 阵 
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图 3-7 男女 身高 .体重 和 年 龄 的 箱 型 图 
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> boxplot( Weight ~ Sex,ylab=" Weight" ) 

> boxplot( Height ~ Sex,ylab=" Height" ) 

> boxplot( Age ~ Sex,ylab=" Age") 

> par( oldpar) 
从 图 3-7 中 可 以 看 出 ,男女 的 体重 、 身 高 有 明显 的 差别 ,而 年 龄 则 差别 不 明显 . 
也 可 以 按 不 同性 别 对 某 一 变量 分 别 作 图 或 计算 . 这 里 只 要 使 用 像 Weight 
[ Sex= =“F” ] ,Height[ Sex= =“M”] 这 样 取 子 集 的 办 法 就 可 以 把 观测 值 进行 
分 组 . 

> Weight[ Sex= =" F" ] 

[1] 41 45 44 43 40 43 40 41 46 

> Weight[ Sex= =" M" ] 

[1] 48 49 48 50 50 52 55 58 52 48 

更 进一步 ,还 可 以 用 函数 tapply( ) 直接 按 一 个 因子 对 观测 分 组 ,然后 用 天 
数 tapply( Weight ,Sex ,hist) 画 出 图 3-8. 从 图 3-8 中 可 看 出 男女 的 体重 略 有 差 
别 . 


Histogram of F Histogram of M 


w 
nh 


Frequency 
` 
Frequency 
u 


N 


TT TT TN [T T T Tl 
40 42 44 46 48 52 56 


图 3-8 男女 体重 的 条 形 图 


3. 组 间 比 较 
我 们 来 分 析 男 女 的 身高 有 无 显著 的 差别 ,这 是 两 组 的 比较 问题 .上 面 
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EDA 部 分 的 并 排 盒 形 图 已 经 提示 男女 身高 有 明显 差异 ,这 里 用 统计 假设 检验 
给 出 统计 结论 . 

男女 两 组 可 以 认为 是 独立 的 ,而 且 每 组 内 的 观测 也 可 以 认为 是 相互 独立 
的 . 根据 EDA 的 结果 可 以 认为 两 组 都 来 自 正 态 总 体 . 这 样 ,我 们 可 以 使 用 两 样 
本 :检验 .因为 方差 是 否 相 等 未 知 ,我 们 于 脆 用 不 要 求 方 差 相 等 的 近似 两 样本 
1 检验 : 

> attach( c1 ) 

> t. test( Height ~ Sex,conf. level = 0.99) 

Welch Two Sample t-test 

data: Height by Sex 

t = -2.1811， df = 14.832, p-value = 0.0457 

alternative hypothesis; true difference in means is not equal 

to 0 
99 percent confidence interval; 
-7.321008 1. 098785 
sample estimates : 
mean in group F mean in group M 
146. 8889 150. 0000 

结果 p 值 为 0.0457 ,对 检验 水 平 0.01 来 说 ,差异 是 不 显著 的 . 所 以 从 这 组 样本 
看 ,男女 的 身高 没有 发 现 显著 差异 . 

类 似 可 以 进行 男女 体重 的 比较 ,p 值 为 6.971x10” ,差异 极 显 著 . 

4. 回归 分 析 

下 面 研究 对 体重 的 预报 . 从 散 点 图 矩阵 看 ,体重 与 身高 有 明显 的 线性 相 
关 , 所 以 先 拟 合 一 个 体重 对 身高 的 一 元 线性 回归 模型 : 

> lm. fitl =lm( Weight ~ Height,data=cl) 


> lm. fitl 
Call; 
lm(formula = Weight ~ Height, data = cl) 
Coefficients : 
( Intercept) Height 
—128. 559 1.182 


> summary ( Im. fitl ) 
Call: 
lm(formula = Weight ~ Height, data = c1) 
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Residuals: 

Min 1Q Median 3Q Max 
-5.9239 -1.8779 0.5321 2.5761 -4.4401 
Coefficients : 


Estimate Std. Error t value Pr(> |t] ) 

( Intercept) -128. 5589 34.7066 -3.704 0.00176” 

Height 1. 1820 0. 2336 5.060 9.67e-05*" 

Signif. codes: 0 '*" 0.001 '’*” 0.01 0.05 0.1 1 

Residual standard error: 3.343 on 17 degrees of freedom 

Multiple R-Squared: 0. 6009, Adjusted R—squared: 0. 5775 

F-statistic; 25.6 on 1 and 17 DF, p-value: 9. 675e-05 
拟 合 的 模型 方程 为 Weight = -128. 5589 +1. 182xHeight, 复 相关 系数 平方 为 
0. 6009 ,检验 模型 的 斜率 为 0 的 p Ë 29 9.67x10° ,可见 模型 是 显著 的 . 对 于 一 
元 回归 ,可 以 用 命令 abline ( Im. fitl ) 在 因 变 量 对 自 变量 的 散 点 图 上 亚 加 回归 
直线 来 看 回归 效果 , 见 图 3-9. 





142 146 150 154 
Height 


图 3-9 体重 对 身高 的 回归 直线 拟 合 图 


一 般 地 ,plot( ) 函数 可 以 对 lm 拟 合 结果 作出 若干 幅 图 形 来 验证 拟 合 效 
果 .R 中 可 以 作 4 个 图 : 残 差 对 拟 合 值 图 , 残 差 的 正 态 概 率 图 ,标准 化 残 差 绝对 
值 平方 根 对 拟 合 值 图 Cook 距离 图 . 

> oldpar=par(mfrow=c(2,2) ,mar=c(2.5,2,1.5,0.2) ,mgp=c(1.2,0. 
2,0)) 

> plot( Im. fitl ) 
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> par( oldpar) 
结果 见 图 3-10. 


Residuals vs Fitted Normal Q-Q 





40 45 50 5 —+ à 0 L 
Fitted values Theoretical Quantiles 


Scale-Location Residuals vs Leverage 





Standardized residuals 





= 40 45 50 55 0.00 0.05 0.10 0.15 0.20 0.25 
Fitted values Leverage 


Æ 3-10 体重 对 身高 的 回归 诊断 图 


如 果 希 望 每 个 图 都 用 全 窗口 来 看 , 则 不 要 设置 图 形 参数 .在 4 个 图 中 , 残 
差 对 拟 合 值 图 可 以 反映 残 差 中 残留 的 结构 . 如 果 模 型 是 充分 的 , 残 差 应 该 是 随 
机 地 变化 且 没 有 任何 模式 . 残 差 的 正 态 概 率 图 可 以 检验 线性 回归 分 析 的 重要 
假定 一 一 误差 项 服从 正 态 分 布 是 否 合理 ,可 以 看 出 残 差 的 分 布 重 尾 、 轻 尾 、 左 
偏 . 右 偏 等 情况 . 标准 化 残 差 绝 对 值 平方 根 对 拟 合 值 图 可 以 发 现 残 差 的 异常 
值 点 , 即 拟 合 最 差 的 点 ，Cook 距离 衡量 每 一 观测 对 拟 合 结果 的 影响 大 小 , 数 
值 大 的 为 强 影响 点 ,图 中 自动 标 出 了 最 突出 的 点 . 

从 Im. fil 的 回归 诊断 图 看 , 残 差 没 有 明显 的 模式 ,但 残 差分 布 有 轻微 轻 
尾 倾向 ,没有 明显 的 异常 点 . 

下 面 我 们 看 加 入 其 他 变量 能 和 否 进 一 步 改善 模型 的 预报 能 力 . 用 addl( ) 
函数 可 以 判断 加 和 新 的 变量 是 否 可 以 改善 模型 : 

>addl(Im.fitl, ~. + Age + Sex) 

Single term additions 

Model; 
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Weight ~ Height 
Df Sum of Sq RSS AIC 
<none> 189.955 47.745 
Age 1 53.474 136.481 43.463 
Sex 1 138.707 51.248 24. 852 
addl 的 结果 显示 为 一 个 方差 分 析 表 . <none> 行 是 不 加 变量 的 情况 ,Age 
行 是 加 入 一 个 变量 Age 后 的 情况 ,Sex 行为 加 入 一 个 变量 Sex 的 情况 . DF 列 
为 此 变量 的 自由 度 ,Sum of Sq 为 该 变量 对 应 的 平方 和 ,RSS 为 加 入 该 变量 后 
的 残 差 平方 和 ,AIC 为 加 入 该 变量 后 的 AIC 统计 量 值 . AIC 较 小 的 模型 较 好 . 
所 以 ,如 果 加 入 某 个 变量 后 AIC 减 小 ,就 可 以 加 入 此 变量 . 这 里 加 入 Age 和 加 
A Sex 都 使 AIC 变 小 ,所 以 应 该 加 入 这 两 个 变量 . 
如 果 一 开始 就 加 入 了 所 有 变量 , 则 可 以 用 drop1( ) 函数 考察 去 掉 一 个 变 
量 后 AIC 是 否 变 小 : 
> lm. fit2 =lm( Weight ~ Height+Age+Sex，data=ecl ) 
> summary ( Im. fit2 ) 


Call. 

Im(formula = Weight ~ Height + Age + Sex, data = cl) 

Residuals: 

Min 1Q Median 3Q Max 
—-2. 9448 -0. 9273 0.0552 1.0967 3.2369 

Coefficients ; 
Estimate Std. Error t value Pr(>|+|) 
( Intercept) -83.8401 27.0209 -3. 103 0. 00728 ” 
Height 0. 9448 0. 2444 3.866 0.00152 ** 
Age -0.9608 0.9337 -1.029 0. 31973 
SexM 5.6118 1.0650 5.270 9. 44e-05 *" 

Signif. codes: 0 '** 0.001 '*” 0.01 '*'0.05 ”'.'0.1 ”' 1 

Residual standard error; 1. 786 on 15 degrees of freedom 

Multiple R —Squared: 0. 8994 , Adjusted R-squared; 0. 8793 


F-statistic : 44.72 on 3 and 15 DF, p-value: 1.021e-07 
> dropl(lm. fit2) 
Single term deletions 


Model : 
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Weight ~ Height + Age + Sex 
Df Sum of Sq RSS AIC 


<none> 47. 868 25.556 
Height 1 47. 683 95.551 36. 689 
Age 1 3.380 51.248 24. 852 
Sex 1 88.613 136.481 43.463 


从 summary( ) 的 结果 看 ,Age 不 显著 . 用 drop1( ) 可 以 发 现 ,去 掉 Age 会 
使 AIC 从 25.556 变 小 为 24.852 ,所 以 应 该 去 掉 Age. 对 去 掉 Age 后 的 模型 再 
用 dropl() ,发 现 Sex 不 应 该 去 掉 . 在 修改 模型 或 数据 改变 后 重新 拟 合 时 还 可 
以 使 用 update( ) 函数 ,比如 要 从 lm. fit2 中 去 掉 Age ,就 可 以 用 

> lm.fit3=update(lm.fit2,~. -Age ) 

得 到 最 后 的 模型 Im. fit3. 

在 自 变 量 个 数 较 多 时 ,R 提供 了 step( ) 函数 ,用 来 进行 逐步 回归 . 它 从 一 
个 初始 模型 开始 ,自动 判断 增加 或 去 掉 变 量 ,最 后 得 到 较 好 的 模型 : 

> lm. fit0=]lm( Weight 1 ,data=c1) 

> Im.step=step(Im.fit0, ~. +Height+Age+Sex) 

Start; AIC= 63.20 


Weight — 1 

Df Sum of Sq RSS AIC 
+ Sex 1 337.78 138.22 41.70 
+ Height 1 286. 05 189.95 47.74 
+ Age 1 61.75 414.25 62. 56 
<none> 476.00 63.20 
Step: AIC= 41.7 
Weight ~ Sex 

Df Sum of Sq RSS AIC 
+ Height 1 86. 97 51.25 24.85 
+ Age 1 42.67 95.55 36.69 
<none> 138.22 41.70 
- Sex 1 337.78 476. 00 63.20 


Step: AIC =24. 85 
Weight ~ Sex + Height 

Df Sum of Sq RSS AIC 
<none> 51.248 24.852 
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+ Age 1 3.380 47. 868 25.556 
- Height 1 86.975 138. 222 41.704 
— Sex 1 138.707 189.955 47.745 


得 到 适当 的 模型 后 ,就 可 以 用 模型 进行 拟 合 或 预报 . 只 需 对 模型 拟 合 结 
果 用 predict( lm. fit3 ) 函数 , 即 可 以 得 到 体重 的 预报 值 ， 
李 丽 EE He F BA 刘 玲 KRÆ 陈 美玲 KE XJ 
43.38 44.86 45.6 44.11 39.68 41.9 38.94 39.68 44.86 51.00 
王峰 李 明 KI 张强 张 勇 胡 进 车 丰 王建 军 汪 平 
51.74 48.04 49.52 50.26 51.74 53.22 54.7 50.26 49.52 
我 们 还 可 以 用 命令 plot( Weight) 和 points( Im. fit3 ,col= “blue” ,pceh = 8 ) ##& 
出 体重 原始 数据 与 预报 值 的 对 比 图 (图 3-11). 





图 3-11 体重 原始 数据 与 其 预报 值 的 对 比 图 


如 果 想 对 新 数据 做 预报 ,只 需 在 predict( ) 函数 调用 时 加 入 新 数据 的 数据 
框 作为 参数 : 
> new. data = data. frame ( Height = c ( 150, 151. 2,148,149. 7 ) , Sex = 
e("M" "Fe ,"M","F")) 
> predict( Im. fit3 ,new. data) 
1 2 3 4 
51. 00000 45.74517 49. 52028 44.63538 


3.5 随机 数 的 应 用 


产生 随机 数 是 做 统计 模拟 的 基础 ,而 如 何 产生 随机 数 的 方法 在 一 般 的 计 
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算 机 书籍 中 都 有 所 介绍 ,我 们 在 此 不 再 装 述 . 这 里 我 们 只 介绍 随机 数 在 计算 积 
分 上 的 应 用 . 本 书 中 的 随机 数 若 未 特别 说 明 都 是 指 (0,1) 随机 数 . 
令 g(X) 是 一 个 函数 ,假设 我 们 要 计算 0 : 


9 = | eC) ds 
注意 到 如 果 忌服 从 (0,1) 上 的 均匀 分 布 , 那 么 就 有 6 = E[g(U)]. # U,, 
U,,-.,U, Æ (0,1) 上 的 均匀 随机 变量 , 则 随机 变量 gU, ),g(U,), gU) 
是 均值 为 6 的 独立 同 分 布 的 随机 变量 . 因此 由 强大 数 定律 以 概率 1 有 
y ETD L, Elg(U)] =0 当 k— e. 


从 而 通过 产生 大 量 随机 数 u, 且 取 g(w,) 的 平均 值 作 为 近似 值 , 我 们 就 能 够 近 
似 得 到 0, 此 近似 积分 方法 称 为 Monte Carlo 方法 . 
我 们 若 要 计算 


o= glx) a, 


可 利用 变换 y = dy = -此 -得 到 


b-a” b-a 








9= | gla + (b = a)y) (B = a)dy = | h(y)dy, 
HP h(y)=zg(a+(b-a)y)(b-a). 因此 我 们 连续 地 产生 随机 数 并 将 h 在 这 
些 随机 数 上 的 取 值 进行 平均 ,就 能 近似 得 到 o. 
计算 上 述 积 分 的 R 程序 : 
fl =function(n,a,b,g) { 
x=runif(n) 
sum( (b-a) *g(a+(b-a) * x))/n 
| 


【 例 3.1]】 售 计 积 分 ods 


我 们 先 定义 函数 g = exp(x +x), 其 RR 代码 如 下 : 
g=function(x)exp(x+x’2) 

在 R 中 再 调用 函数 但， 
>fl(10000 ,-2 ,2 g) 

得 到 积分 值 为 92. 196. 或 者 直接 利用 R 的 内 其 积分 函数 : 
>integrate(g,—-2,2) 

也 可 得 到 积分 值 为 93.16275( 绝 对 误差 小 于 0. 00062). 
类 似 地 , 若 我 们 要 计算 
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0 = | g(x)dx, 





J AF -l 二 一 dx -_ x? PA 
我 们 通过 变换 y = pY = CT dx 得 到 
9 = | (7)dy， 
(> - 1) 
其 中 h(y) = 一 一 


用 随机 数 估计 积分 在 多 元 积分 中 的 用 途 显得 更 加 突出 . 假设 g 是 一 个 有 

n 个 自 变量 的 函数 , 若 我 们 要 计算 
0= [S ec dx dx dx, , 
首先 我 们 注意 到 用 Monte Carlo 方法 估计 9 的 关键 是 
0 = Elg(U,,U,,.…,U,)], 

其 中 U, U, e, U, 是 相互 独立 的 (0,1) 上 的 均匀 分 布 随机 变量 . 

因此 我 们 产生 天 个 独立 的 集合 ,每 个 集合 由 个 独立 的 (0,1) 上 的 均匀 
分 布 随机 变量 构成 : 


U, Uz, U, 
V,U, U 
Ui, Ut, U} 


KA gU, U, Ui), i=1,2, k ERA HA 0 Ai y a p NEE, 
Pel U,VU,',,U,) 
故我 们 就 可 用 一 P 来 估计 6. 





【 例 3.2] 估计 二 重 积分 :| ee"dzdy, 其 R 程序 如 下 


>X =runif( 10000 ) 

>Y = runif( 10000 ) 

>f=function(x,y)exp( (x+y)’) 

>sum(f(X,Y) )Z10000 
运行 上 述 程序 得 到 积分 值 为 4. 907506. 

【 例 3.3】 (的 估计 ) 假 设 随机 变量 (X,Y) 是 服从 面积 为 4、 中 心 在 原 
点 的 正方 形 上 的 均匀 分 布 , 即 它 是 图 3-12 中 的 指定 区 域 的 随机 点 . 现在 我 们 
考虑 随机 点 落 在 半径 为 1 包含 在 正方 形 中 的 圆 盘 的 概率 . HT (X,Y) 是 正方 
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形 上 的 均匀 分 布 ,就 有 


PIXY) N| -PIX +Y < 1 = FREMRI 


从 而 , 若 我 们 在 正方 形 中 产生 大 量 的 随机 数 , 则 落 在 圆 中 的 随机 数 比 率 近 似 为 
+ 如 果 筷 和 了 了 是 独立 的 且 都 服从 ( - 1,1) 上 的 均匀 分 布 ,其 联合 密度 将 是 


Kans, -1<x<1，-1<ysl 





图 3-12 随机 数 的 投 点 


AA (X,Y) 的 联合 密度 在 正方 形 中 为 常数 ,由 定义 知 , (X,Y) 在 正方 形 
中 服从 均匀 分 布 .如果 U 服从 (0,1) 上 的 均匀 分 布 ,那么 20 服 从 (0,2) 上 的 
均匀 分 布 ,等 等 , 25 - 工 服从 (- 1,1) 上 的 均匀 分 布 . 因 此 如 果 我 们 产生 随机 
数 U MU, Q X =2U, -1 和 YY=20 -1, 并 定义 
r= [LE +Y <1, 
0, 否则 . 


EU] P| +Y <1) =—. 


从 而 我 们 能 用 大 量 的 随机 数 对 u u, 来 估计 全, 也 就 是 用 满足 (2u, - 1)? + 
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(2u, - 1) < 1 的 点 与 正方 形 中 点 的 比值 来 估计 T 其 R 程序 如 下 : 


f=function(n) | 
k=0;ul =runif( n) ;u2 =runif( n) 
X=2 *=ul-1;Y=2 *u2-1 
for(i in 1:n)| 
if(X[i]2+Y[i]2<=1) 
k=k+1 
| 
4 x k/n 
l 


另外 一 种 估计 的 方法 是 计算 积分 | Vi = de =T ,这 种 估计 积分 的 
方法 在 上 面 已 经 介绍 了 , 称 为 平均 值 法 。 


练 习 3 


1. 设 下 服从 正 态 分 布 W(1,2) ,用 R 计 算 PIE < 1.5) 和 Pi |X - 
1.5| > 1]. 

2. 设 蕊 服从 二 项 分 布 B(100,0.6) ,用 有 计算 P|X < 6] #l P|4 < X = 
20]. 

3. 设 互 服从 指数 分 布 E(1.5), 计算 其 0.75 分 位 数 和 中 位 数 . 

4. 设 壮 服 从 泊 松 分 布 P(04) , iA PIS < X s10}. 

5. 设 某 工厂 在 正常 情况 下 生产 的 电灯 泡 的 寿命 (小 时 ) 服 从 正 态 分 布 . 
从 该 工厂 生产 的 一 批 灯 泡 中 随机 抽取 10 个 灯泡 , 测 得 其 寿命 为 

1450 ,1480 ,1640 ,1610. 1500 ,1600 ,1420 ,1530 ,1700. 1550. 

在 检验 水 平 a = 0.01 下 , 试 检验 这 批 灯 泡 的 寿命 是 否 显 著 超过 1600 小 时 ,并 
给 出 其 置信 和 度 为 99% 的 置信 区 间 . 

6. 调查 某 地 每 亩 30 万 苗 和 50 万 苗 的 稻田 ,分 别 得 到 亩 产量 数据 如 下 : 
30 万 苗 800 840 870 920 850 835 840 860 865 810 
50 万 苗 900 880 890 890 840 885 895 880 875 875 885 895 
在 检验 水 平 a = 0. 01 下 , 试 检验 两 种 密度 的 亩 产量 是 否 有 显著 的 差异 . 

7. 某 品种 水 称 糙 米 含 锅 量 yY(mg/kg) 与 地 上 部 生物 量 x, (10g) 及 土壤 含 
锅 量 x, (100mg/kg) É5 8 组 观测 值 如 下 : 
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x, 1.37 11.34 9.67 0.76 17.67 15.91 15.74 5.41 

x 9.08 1.89 3.06 10.2 0.05 0.73 1.03 6.25 

y 4.93 1.86 2.33 5.78 0.06 0.43 0.87 3.86 
试 建立 二 元 线性 回归 方程 ,并 进行 检验 和 预报 . 
8. 用 模拟 的 方法 近似 计算 下 列 积分 ,并 和 已 知 的 精确 答案 进行 比较 . 


A) GC - Oa; 
(2) fa +) dx; 
G) f” expl - l dz; 


(4) j sas dxdy. 


1 , 若 y < *] 
0 ,否则 

9. 用 随机 模拟 的 方法 计算 Cov(U,e”), 其 中 U 是 (0,1) 上 的 均匀 随机 变 
E ,并 和 你 的 精确 答案 进行 比较 . 

10. 对 (0,1) 上 的 均匀 随机 变量 U, ,U,,…, 定义 


N= min{n: Y U, > 1}. 
i=l 


[提示 : 令 L(x) ={ 


FB, N 等 于 使 其 和 超过 1 的 随机 数 的 个 数 . 
通过 产生 10000 个 N 的 值 来 估计 ELN], 并 猜测 EL N] 的 理论 值 是 多 少 . 
11. 令 U.,i 之 1 是 随机 数 序列 .定义 


N = min{ n: J] U, > e | ， 
i=1 


其 中 Hu, = 1. 


(1) 模 拟 计算 E[ N]. 
(2) 通 过 模拟 计算 PIN = il,i=0,1,2,3,4,5,6. 


103 


模拟 随机 变量 
如 果 已 知 某 个 概率 分 布 ,我们 如 何 产生 出 具有 这 个 分 布 的 随机 变量 的 值 


呢 ? 本 章 将 介绍 一 些 产生 随机 变量 值 的 方法 . 同时 ,这些 内 容 也 是 在 进行 统计 
模拟 时 如 何 进行 随机 抽样 的 基础 . 


4.1 逆 变 换 方 法 


1. 离散 随机 变量 情形 
假设 需要 生成 具有 如 下 概率 函数 的 离散 随机 变量 大 的 值 


P{X =x} =p; J=0,1,…， Xp; = 1. 
为 此 , 先 产 生 一 个 随机 数 U, 并 令 
Xo U < Po, 


zi, 若 po < U < Po tp, 
X = 
j-1 i 
x; # > p < U < > pi， 
i=0 i=0 


则 X 即 为 具有 此 概率 隔 数 的 随机 变量 的 值 . 其 原理 是 
f #0 <a<b<1,PjasU<b}=b-a, WE 
P | X = x;| -PÍ Xe < U < Zr) =p; 
J 1 X BRER BJ R A k Aa BJ EDLE E. 
注 : 若 x,,i 宇 0 是 有 序 的 且 x。< x, < x, < …, NO F 3228 XAN RA, 
就 有 F(x) = È Pio 以 及 
# F(x) <€ U < F(x), W X =s. 
换言之 ,在 产生 随机 变量 U 后 ,我们 根据 U 的 取 值 区 间 [ F(x..,) ,F(x,)) 确定 
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站 的 值 (或 者 等 价 地 通过 找 F( U) 的 着). 因此 ,上 述 方法 称 为 生成 天 的 离散 道 
变换 方法 . 
按 上 述 方法 产生 一 个 随机 变量 所 花 的 时 间 与 要 找 的 区 间 数 成 比例 . 正 因 
如 此 ,有 时 需要 按 p, 的 降序 来 考虑 丰 的 可 能 值 x,. 
【 例 4.1】 模拟 具有 如 下 概率 分 布 的 随机 变量 X : 
pl =0.10, p, =0.05, p, =0.40, p, =0.43， 其 中 p; =P{X =j}. 
其 算法 如 下 : 
产生 一 个 随机 数 U, 
35: U < 0.10, 则 令 X = 1 并 停止 ; 
# U < 0.15, 则 令 X =2 并 停止; 
# U < 0.55, 则 令 X =3 并 停止 ; 
其 他 , 令 工 = 4. 
车 要 产生 个 这 样 的 随机 变量 ,其 R 程序 为 
>X=rep(0,n) # 或 X=numeric(n) 
>for(iin 1:n)1 
u=runif(1) 
if (u<0.1) X[ 订 =1 
else if (u<0.15) X[i] =2 
else if (u<0.55) X[ i] =3 
else X[ i] =4 
| 
然而 一 个 更 有 效 的 算法 为 
产生 一 个 随机 数 U, 
35 U < 0.45, 则 令 = 4 并 停止 ; 
# U <0.85,BJ X =3 并 停 上 ; 
# U < 0.95, 则 令 和 = 1 并 停止 ; 
其 他 , < X = 2. 
当然 也 可 以 用 R 的 内 置 函 数 sample() 来 产生 此 随机 变量 : 
>X=1:4 
>p=c(0.10,0.05 ,0.40,0.45) 
>sample(X,5,p=p,replace =TRUE)# 产 生 5 个 可 以 重复 的 随机 变量 X, 
replace = TRUE 表示 抽样 可 重复 ,默认 值 是 FALSE ,表示 不 重复 抽样 . 


车 要 产生 具有 离散 均匀 分 布 的 随机 变量 XX 的 值 , 即 PIX = j) = Lj =1, 
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2,…,n ,运用 算法 


3 J 


X=;, 车 lesu <, 


AIER X 0548. RT, j- 1 < nU <jBHF, X =j, 也 就 是 X=Int(nV) + 1, 
其 中 Int(x) 有 时 写 为 [xz] , 即 不 大 于 x 的 整数 部 分 .其 R 程序 为 
>U =runif(1);X=floor(n * U)+1 
或 者 用 函数 sample ( ) 来 产生 
>X=sample(1:n,1) - 
【 例 4.2】 (随机 排列 /置换 ) 假 设 我 们 想 要 产生 1,2,… ,n 的 一 个 排列 ， 
WA n! 个 等 可 能 的 顺序 .我 们 给 出 产生 该 随机 排列 的 两 种 方法 . 
方法 I 首先 随机 地 选择 数字 1,2,…,n 中 的 一 个 数 并 将 此 数 放 在 第 n 
个 位 置 , 接 着 从 剩 下 的 n - 1 个 数 中 随机 地 选择 一 个 并 将 之 放 在 第 n -1 个 位 
置 , 再 接着 从 剩 下 的 n -2 个 数 中 随机 地 选择 一 个 并 将 之 放 在 第 n -2 个 位 置 ， 
等 等 . ` 
方法 I ”以 任何 一 个 初始 顺序 P,P,,… P, 开始 ,从 位 置 1,2,…,n 中 随 
机 地 挑选 一 个 然后 与 位 置 n 中 的 数 互 换 . 随后 ,我 们 随机 地 选择 位 置 1 ,2,…， 
n -1 中 的 一 个 数 并 与 位 置 n - 1 中 的 数 互 换 , 等 等 . 
方法 工 的 算法 : 
Stepl : 令 Pi,P,,…,P, 是 1,2,…,n 的 任意 一 个 排列 (例如 ;选择 P= 
j,ij=1,2,.…,n ). 
Step 2: 邻 =n. 
Step 3 :产生 一 个 随机 数 U, 并 令 1= Int(kU) + 1. 
Step 4: 互 换 P, 和 P, 
Step 5: 令 上 二 8 - 1, WẸ k > 1 就 回 到 Step 3. 
Step 6; P,P,,… ,P, 就 是 所 要 的 随机 排列 . 


其 R 程序 为 
perm = function(n | 

X=l:n;k=n 

while( k>1) Í 
u=runif(1);I=floor(k *u)+1;V=X[k] 
X[k]=X[I];X[I]=V;k=k-1 

| 

X 
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上 述 算法 的 一 个 重要 性 质 是 从 整数 1,2,…,n 中 可 以 产生 有 7 个 元 素 的 
随机 子 集 . 即 按照 这 个 算法 直到 位 置 n,n - 1,… ,n -r+1 都 填 满 数字 为 止 .在 


这 些 位 置 的 元 素 就 构成 了 随机 子 集 (在 做 这 件 事 情 时 ,我 们 假设 7 < > ;如 果 


r > S, 我 们 也 可 以 找 一 个 含有 n - r 个 元 素 的 子 集 ,并 令 不 在 此 子 集中 的 元 


素 构成 个 元 素 的 随机 子 集 ). 当然 用 函数 sample(1:n) 也 很 容易 实现 。 
【 例 4.3】 (几何 随机 变量 ) 假 设 X 是 一 个 具有 参数 p 的 几何 随机 变量 ， 
Bp 
P|X =i} =p©', ¿i> 1,BJBrhq = 1 - p. 
易 知 


j-1 
Y PiX =i} =1-P|X>j-1}=1-g", j>1, 
i=l 


产生 一 个 随机 数 U, #1- <U<1-gd, RESMA, d < 1-U <q, 
JJ X =j 实际 上 ， 
X=minlj:g < 1 - U] = Imt( 180-0) +1. 
089 
注意 到 1 - 0 也 是 服从 (0,1) 上 的 均匀 分 布 ,得 到 
X = m ge + 1 
98q 
即 为 具有 参数 p 的 几何 随机 变量 . 
产生 n 个 参数 为 p 的 几何 随机 变量 的 R 程序 : 
>U=runif(n); X=floor(log(U)/log(1-p))+1 
【 例 4.4】 (Poisson 随机 变量 (I ) ) Poisson 随机 变量 的 概率 函数 为 


p:=P|X =i} =e, i=0,1,. 
l! 


用 逆 变 换 产生 些 随机 变量 的 方法 的 关键 是 递归 式 : 


À . 
，， 一 0. 4.1.1 
Pisi i + LE l 0 ( ) 


利用 上 述 递 归 方法 计算 Poisson 分 布 的 概率 程序 如 下 : 
p=numeric(k) 
p[ 1] =exp(-lambda) 
for( n in 2:r) f 
p[n] =exp( ~ lambda} 
for(j in 0: (n - 2) ) Í 
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p[n]=p[n] * lambda/(j+1) 
I 
p[n] 
| 
而 产生 带 有 均值 A 的 Poisson 随机 变量 的 逆 变 换算 法 如 下 ( i 为 p = p; 的 
指标 , p; =PIX =i}, F=F(i)=P{X < il): 
Stepl :产生 一 个 随机 数 U. 
Step2: i =0,p =e™,F = p. 
Step3: W U < F, 9 X = i 3F#Z Ik. 
Step4: p +— Ap/(i + 1) ,F — F + pr,i<— i + 1. 
Step5 :返回 Step3. 
产生 n 个 参数 为 A 的 Poisson 随机 变量 的 R 程序 : 
rpois =function( n ,lambda ) | 
for(j in 1:n) { u=runif(1) 
Y=rep(0,n);i=0;p=exp(-lambda);F=p 
while(u>=F) 1 
p=lambda * p/(i+1);F=F+p;i=i+1 
l 
Y[j]=i 
| 
Y 
l 
上 述 算法 连续 地 验证 了 Poisson 随机 变量 的 值 是 否 为 0, 是 和 否 为 1, 是 否 
为 2, 等 等 . 由 此 知 ,需要 比较 的 次 数 将 比 产生 的 Poisson 的 值 大 1. 因此 ,平均 
而 言 ,上 述 将 需要 进行 1 + 和 A 次 查找 . 然而 , 当 入 很 小 时 ,这 种 方法 是 精细 的 ， 
但 当 ， 很 大 时 ,上 述 算法 还 可 以 极 大 地 改进 .事实 上 ,一 个 具有 均值 人 的 Pois- 
son 随机 变量 是 很 可 能 取 最 接近 À 的 两 个 整数 值 中 的 一 个 . 一 个 更 有 效 的 算 
法 是 验证 这 些 值 中 的 一 个 ,而 不 是 从 0 开始 一 直 搜 寻 下 去 . 例如 , 令 7= 
Int( 和 A) , 并 用 递归 式 (4.1.1) 来 确定 F(1). 现在 通过 产生 一 个 随机 数 U 来 获 
得 一 个 带 有 均值 A 的 Poisson 随机 变量 X, 注意 到 通过 观察 是 否 UV < F(T) 来 
判断 是 否 X I. WRX I, 就 从 7 开始 向 下 查找 ,否则 从 了 + 1 开始 向 上 查 
找 . l 
根据 此 算法 需要 检索 的 次 数 大 约 比 随机 变量 X 与 其 均值 的 绝对 差 大 
1. 因为 对 大 的 A 一 个 Poisson 随机 变量 (根据 中 心 极限 定理 ) 近 似 为 均值 和 方 
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差 都 为 人 的 正 态 随机 变量 ,得 到 
查找 的 平均 次 数 ~~1 + E[ | -入 |] 


-1+ viej =M] 


=1 + /AE[ |Z|] (其 中 Z ~ N(0,1)) 
=1 + 0.798./A. 
其 中 X ~ N(A,A) 也 就 是 用 算法 (4.1.1) 平 均 检索 次 数 的 增长 速度 等 同 于 
VA 而 不 是 人 本 身 . 
【 例 4.5】 (二 项 随机 变量 ) 设 参数 (n,p) 的 二 项 随机 变量 了 的 概率 函 
数 为 


n! i n-i . _ ... 
PIX =i} = pr P (1 - p) ， =0,1,,n. 


则 其 递归 等 式 : 


=i -22İi_P_piy=i 
PiX =i+1} iII- p il. 


&pr=P|X=i},F=P|X si}. 
产生 此 随机 变量 的 算法 : 
Step 1 :产生 一 个 随机 数 U. 
Step 2: c=p/(1 —-p),i= O0,pr = (1 — p)',F = pr. 
Step 3: 如 果 U < F, £ X = i 3FfËE IE. 
Step 4: pr +— [e(n — i)Z(i + 1)]pr,F — F + pr,i— i + 1. 
Step 5:34 [š] Step3. 
产生 m 个 参数 为 (n,p) 的 二 项 随机 变量 的 R 程序 : 
rb=function(m,n,p) | 
Y=rep(0,m) 
for(j in 1;m) į 
c=p/(1-p);i=0;pr=(1-p)";F=pr 
u=runif(1) 
while(u>=F){ 
pr=c * (n-i) * pr/(i+1);F=F+pr;i=i+1 
l 
Y[j]=i 
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} . 

上 述 算法 验证 了 是 否 工 = 0, 然后 是 否 夺 = 1, 等 等 .可 看 出 检索 的 次 数 比 
于 大 1. 因 此 ,平均 而 言 ,产生 了 需要 检索 1 + np 次 ,因为 一 个 B(n,p) 的 随机 
变量 表示 了 7 次 独立 试验 中 成 功 的 次 数 ,其 中 每 次 试验 成 功 的 概率 为 P. 这 样 
的 随机 变量 能 够 通过 n 减 去 一 个 B(n,1 - p) 随机 变量 得 到 (为 什么 ?). 因此 ， 


当 p > 方 时 ,我 人 能够 产生 一 个 8(n,1 - p) 随机 变量 ,通过 上 述 方法 从 中 


减 去 B(n,p) 的 随机 变量 的 值 . 

附注 1 产生 一 个 B(n,p) 随机 变量 的 另 一 种 方法 是 通过 产生 n 个 随机 
数 U, U, U HS X KIE U, <p 的 U; 的 个 数 ,再 将 看 做 nn 次 独立 试验 成 
功 次 数 而 得 到 . 如 果 将 U, < p 看 做 是 第 i 次 试验 成 功 ,并 注意 到 这 个 事件 发 生 
的 概率 为 p, 就 容易 看 到 这 样 就 产生 了 一 个 B(n,p) 随机 变量 . 这 种 方法 要 求 
n 个 随机 数 并 作 n 次 比较 ,而 上 述 逆 变换 算法 仅 需 要 一 个 随机 数 ,平均 要 做 
1 + np 次 比较 . 

附注 2 HHE np 很 大 时 , 较 好 的 做 法 是 先 确定 产生 的 值 是 否 小 于 或 等 
于 7= Ini(np), 或 者 是 否 大 于 了 在 前 一 种 情形 下 ,从 1 出 发 ,依次 检索 1- 1, 
7 - 2,…, 等 等 ;而 在 后 一 种 情形 下 ,我 们 从 7+ 1 出 发 ,依次 朝 上 检索 . 

【 例 4.6】 (多 项 分 布 ) 假设 一 个 试验 以 概率 pi,p,，,…,p, 产生 结果 1, 


2,…,r 之 一 , 且 > p, = 1. Ë n KIAR, H X, 表示 n 次 试验 中 出 现 结果 i 


的 试验 的 次 数 , 则 随机 向 量 (X,,X,,…,X,) 服从 多 项 分 布 ,其 联合 概率 函数 
为 


. n! moon d 
P| X, =%,,i= 1,2,.…,r) Sxl! xl Pi ‘ps Up 2 s = n. 


x! x,! 

模拟 此 随机 向 量 的 方法 依赖 于 > 和 的 大 小 . 

如 果 -相对 来 说 较 大 ,在 这 些 试验 中 很 多 结果 不 会 出 现 , 则 最 好 的 方 
法 : 

Step 1: 产 生 独 立 的 随机 变量 了,Y,,…,Y, E4 PE si} =p, i=l, 
2, r, j=1,2,.,n. 

Step 2: $ X, =) 表示 对 了 =i，j=1,2,…,n，i=1,2,…,r 的 计数 . 

产生 m 组 多 项 分 布 随 机 向 量 的 R 程序 为 

exam4_6_1=function(m,n,r,p) | 
X=matrix(0 ,nrow = m,ncol=r) 


for(i in 1;m) į 
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Y=sample(1:r,n,prob=p,replace=TRUE) 
# replace =TRUE 表示 可 重复 抽样 
for(j in 1 :7r) | 


X[i,j] =length( Y[ Y==j]) 


| 
X 


| 
如 果 n 相对 于 7 较 大 , 则 X, ,X,,… X, 能 依次 模拟 得 到 . 其 方法 为 
Step 1: 产生 服从 分 布 B(n,P;) 的 随机 变量 X, HIE x. 


Step 2: 产 生 服从 分 布 Bn - x, y) 的 随机 变量 X, 的 值 x. 





Sep 3: 产 生 服从 分 布 8{” - zaop 7 |" Ypi) ) apan x. 
的 值 x 
Step 4: 令 X=n- Y x. 
HJ X = (xx ，…，x,) 就 是 所 要 的 多 项 分 布 的 随机 向 量 . 此 算法 的 原理 如 下 : 
P|X, = 和 PP 和 
PX, = x, | X, = xi 
产生 m 组 多 项 分 布 随机 向 量 的 R 程序 为 
ploy =function (m,n,r,p) | 
X=matrix(0,ncol=r,nrow=m) 
for(i in 1:m)| 
X[i,1]=rbinom(1,n,p[1]) 
for(j in 2;(r-1)){ 
X[i,j]=rbinom(1 ,n-sum(X[i,1:(j-1)]), 
p[j]/(1-sum(p[1:(j-1)]))) 
| 
X[i,r]=n-sum(X[i,1:(r-1)]) 
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2. 连续 型 随机 变量 情形 

设 U 是 (0,1) 上 的 均匀 随机 变量 . 对 任何 连续 分 布 函数 F , 定义 随机 变量 
XH 

X=F`(U), 

则 XX 有 分 布 函 数 F. 

上 述 论 断 成 立 的 原因 如 下 : 

记 F, H X = F”'( U) 的 分 布 函 数 . 则 

F,(x) = P|X < x] =P|F (U) < zx] =P|U < F(x)| = F(x). 
【 例 4.7] 设 连续 型 随机 变量 X 的 密度 函数 为 
c, xw <S x < x, l1=0,1,2,-- n - 1, 
p00 


0, 其 他 . 
其 中 cl >0，a=xo < x, < … < a, =b ( a,b 可 为 无 穷 )， | p(z)dx = 1. 


令 pi= plads, i=1,2,,n, WIHER x, $ is maxlj:z < x), # 


F(x) =p; + c,(x — x,)- 
H F(X) = U HJ #t H 


X = x, + 


此 处 i 满足 p; < U < p... 其 算法 如 下 : 

Step 1 :产生 随机 数 U. 

Step 2: m i, WŒ p, < U < pur 

Step 3: x = x, + (U =- p,)Ze,. 

这 个 例子 的 随机 变量 在 第 7 章 中 进行 模拟 识别 时 要 用 到 . 

【 例 4.8】 (指数 随机 变量 ) 设 X 是 参数 为 1 的 指数 随机 变量 , 则 其 分 布 
函数 为 





F(x)= 1 - e”. 
@x=F`'(u), MJ u = F(x) = 1 - e ,进而 有 
x =- log(1 ~- u). 

其 算法 为 :生成 一 个 随机 数 US X = F''(U)=- log(1 - U) , 即 产生 出 
参数 为 1 的 指数 随机 变量 . 注意 到 1 -0 也 是 (0,1) 上 的 均匀 分 布 , 故 
-log(1 - U) 和 -logZ 有 相同 的 分 布 . 也 就 是 ,一 个 随机 数 的 负 对 数 服 从 参 
数 为 1 的 指数 分 布 . 

又 注意 到 当下 是 均值 为 1 的 指数 随机 变量 时 ,对 任何 常数 e, cX ESEN 
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c 的 指数 随机 变量 . 从 而 一 个 参数 为 ( 均值 为 ~) 的 指数 随机 变量 能 够 通过 
随机 数 U 3 
=- -ljo 
X= Xl gU 


得 到 . 

【 例 4.9】 (Poisson 随机 变量 ( I)ER 1 章 中 介绍 过 , 当 两 个 相继 的 事 
件 的 间隔 时 间 是 独立 的 且 服 从 参数 为 人 的 指数 分 布 时 ,这 些 事件 出 现 的 个 数 
就 构成 一 个 参数 为 人 的 Poisson 过 程 .那么 到 时 刻 1 出 现 的 事件 数 N(1) 服从 
均值 为 人 的 Poisson 分 布 . 如 果 我 们 令 X; ,i=1,2,… 表示 相继 两 个 事件 的 时 间 


间隔 ,那么 第 n 个 事件 发 生 的 时 刻 为 SX, 所 以 到 时 刻 1 发 生 的 事件 数 为 


N(1) = max [ n: Y X, < 1}. 
我 们 能 够 通过 生成 随机 数 U0, ,U,,… Un 并 令 


N =max[n; > 一 —losU, < 1} 
=maxÍn D logU, => -A} 
> - 


=max{n:log( U, U, U.) 
=max{n; U, U, U, > e™} 
而 得 到 N = N(1) 一 一 带 有 均值 和 的 Poisson 随机 变量 . 或 者 写 为 
N = min(n:U,U,: U, < e - 1. 
产生 nn 个 参数 为 A 的 Poisson 随机 变量 的 R 程序 : 
pois. ex4_9 =function(n,lambda) | 
X=0 
for(i in 1:n) | 
p=runif(1);N=1 
while(p<=exp(-lambda) ) {p=p * runif(1) ;N=N+1] 
X[i]=N-1 


A} 


} 
X 


| 
【 例 4. 10】 (Gamma 随机 变量 ) 设 X 为 Gamma (n, À) 随机 变量 , 则 其 分 
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布 函数 为 
= Ae a-1 
F(x) = Í a TUN) ay, 
由 于 其 分 布 函数 无 显 式 的 表达 式 ,难以 直接 利用 逆 变 换 法 产生 Gamma 随机 变 
BL. 因为 Camma( n,A) 随机 变量 X 是 nn 个 相互 独立 的 具有 参数 A 的 指数 随机 
变量 和 ,所 以 可 利用 例 4.7 先 产生 n 个 独立 的 参数 为 A 的 指数 随机 变量 ,再 产 
EX. 其 算法 如 下 : 
Stepl : 产生 ”个 随机 数 U. ,0 ,UU, 


1 1 1 1 
Step2: £ X =- XLV 一 x ogU, 一 … 一 A IogU, =- 人 1og U, U, U,). 


其 产生 mm 个 T(n,A) 随机 变量 的 R 程序 为 
Gam. ex4_10 = function(m ,n , lambda ) | 
X=0 
for(i in 1:m) { 
U=runif(n);X[i] =-1/lambda * sum(log(U)) 
l 
X 


| 
4.2 筛选 法 


筛选 法 最 早 由 著名 的 数学 家 John von Neumann 提出 ,由 下 面 的 介绍 可 以 
看 出 在 模拟 连续 型 随机 变量 的 情形 时 其 优越 性 更 加 明显 . 

假设 要 模拟 一 个 具有 概率 函数 |p, > 0] (或 者 密度 函数 f(x) ) 的 随机 
变量 X, 但 此 概率 函数 (或 密度 函数 ) 比较 复杂 ,那么 可 以 通过 先 模 拟 一 个 随 
机 变量 了 与 X 具 有 相同 的 取 值 ,但 其 概率 函数 [qj > 0} (或 者 密度 函数 
g(x) ) 相 对 简单 ,然后 以 与 AEEA 成 比例 的 概率 接受 此 模拟 值 ,这 样 就 
可 以 模拟 出 X 的 值 . 此 方法 称 为 拒绝 法 或 筛选 法 (Rejeetion ) . 

特别 地 , 令 c 为 一 常数 ,使 得 


如 < c， 对 所 有 满足 m > 0 j, 





或 者 
fO) =c, 对 所 有 的 y. 
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其 算法 如 下 : 
Stepl :模拟 一 个 具有 概率 函数 gj > 0] (或 者 密度 函数 g(x)) 随 
机 变量 了 的 值 . 
Step2 :产生 一 个 随机 数 U. 





iu < Paat) m x= | 
Step3 : 若 U < [3822 y) ， 则 令 X=Y 并 停止 ;否则 回 到 Step! 

现在 证 明 第 选 法 的 可 行 性 . 

定理 4.1 ”第 选 算法 产生 的 随机 变量 大 具有 概率 函数 P|X =j| =p, j= 
0,1,… (或 密度 函数 /(x) ) , 且 得 到 随机 变量 x 的 值 的 选 代 次 数 是 一 个 均值 
为 。 的 几何 随机 变量 . 

证 “在 此 只 证 离散 型 情形 . 先 求 一 次 迭代 接受 7 的 概率 . 首先 注意 到 

Pi7 = /被 接 受 | = PIY = 放 P1j 被 接受 |Y =j) =q 2i a B, 
关于 7 求 和 得 到 产生 的 随机 变量 被 接受 的 概率 为 
PIREZ] = y P: = 二. 


因为 每 次 迭代 都 是 独立 的 ,产生 一 个 具有 概率 为 二 的 值 ,所 以 所 需 的 和 迭代 次 


数 是 均值 为 。 的 几何 随机 变量 , 故 
P|X=j|= Y. P|X =j,j 在 第 n 次 先 代 时 被 接受 | 


C 


-0 全 
【 例 4. 11】 假设 模拟 一 个 从 1,2,… ,10 中 任 取 一 值 的 随机 变量 X, 其 概 
率 分 布 律 见 表 4-1. 


-了 (1 - 1) ”P1y =j,j 被 接受 | 





直接 的 方法 是 前 述 的 逆 变 换 法 , 另 一 种 方法 是 此 处 的 筛选 法 . 在 此 只 介绍 
筛选 法 的 算法 , 取 随 机 变量 了 ,其 分 布 律 见 表 4-2. 
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表 4-2 Y 的 分 布 律 





W c = max Ë. = 1.2. 


其 算法 如 下 : 
Step 1 :产生 一 个 随机 数 U, , 32 Y = Int(10U,) + 1. 
Step 2 :产生 第 二 个 随机 数 U,. 


Step 3: 若 U, < =”, 令 X=Y 并 停止 ;否则 回 到 Step 1. 


产生 此 随机 变量 式 的 = 个 值 的 R 程序 为 
rej. exam4_10 =function( n) | 
X=rep(0,n);p=c(0.11,0. 12 ,0. 09 ,0.08 ,0. 12 ,0. 1 ,0. 09 ,0. 09 ， 
0.1,0.1) 
for(i in 1:n) | 
repeat Í 
ul=runif(1);Y[i]=floor(10 *ul)+1;u2=runif(1) 
if(u2<=p[Y[i]]/0.12) break 
} 
X[i] =Y[i] 
l 
X 
| ñ 
【 例 4.12] 设 随 机 变量 天 的 密度 为 
f(x) =e", x > 0, 





试 模拟 此 随机 变量 X. 
因为 很 难得 到 天 的 分 布 函数 的 显示 表达 式 , 所 以 用 筛选 法 . 随机 变量 区 


的 支撑 为 (0,% ) ， 我 们 考虑 参数 为 村 的 指数 分 布 情形 , 即 考虑 密度 为 g(x)= 


1 


1 ` fx) I Fir 
exp{- >=] > 0 WIER. DAE MES S e, 通过 计算 得 到 


= rea- 2). 
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易 知 c = ma :X > o} = An 


其 算法 如 下 : 

Step 1: 产 生 随 机 数 U,. 
Step 2: 令 Y=- 3log(U,). 
Step 3: 产 生 随 机 数 U,. 


Step 4: 如 果 U, < —Y'exp [2 -之 了 , WG X = Y, 并 停止 ;否则 返回 到 





Step 1. 
其 R 程序 为 
Rej. exam4_12 =function(n ) | 
X=rep(0,n);Y=0 
for(i in l:n) į 
Ul =runif( 1); Y=-3 * log( U1) 
U2 =runif(1) 
while( U2>1/9 * Y * *2 * exp(2-2/3 * Y) ) Í 
U1 =runif(1);Y=-3 * log( U1) 
U2 =runif(1) 
l 
X[i]=Y 


l 
z= 27 
执行 Step 1 的 平均 次 数 为 c =7 ~ 1. 8. 

【 例 4.13】 ( 正 态 随机 变量 ) 设 随机 变量 Z 为 均值 为 0、 方 差 为 1 的 正 态 
随机 变量 .因为 |Z | 的 概率 密度 为 
f) =e, 0 <<x < e, (4.2.1) 
因此 可 用 具有 均值 为 1、 密度 函数 为 z 的 指数 随机 变量 了 来 产生 具有 密度 范 
数 为 /的 随机 变量 于 = | Z| , 其 中 


g(y)= e”, 0 <y< e. 


f(x) -Ee 
g(x) T ; 





易 知 
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由 于 





re be i ah e E 
当 我 们 模拟 了 一 个 具有 如 (4.2.1) 的 密度 函数 的 随机 变量 于 后 , 令 Z 等 可 能 
为 X 或 -多 就 可 得 到 标准 正 态 随机 变量 Z. 
产生 Z 的 算法 为 
Step 1 :产生 具有 速率 为 1 的 指数 随机 变量 Y. 
Step 2 :产生 随机 数 U. 


Step 3 :如 果 U < exp{ - GD , WS X = Y. 否则 返回 到 Step 1. 
Step 4: 产 生 随 机 数 U 并 令 


Y, Ẹ Us 


R 程序 为 
rej. exam 4_12 = function( n) | 
Y=0;Z=0;X=0 
for(i in 1:n)| 
repeat | 
U1 =runif( 1) ;U=runif(1) ;Y=-/log( U1) 
if(U<=exp(-(Y-1)’2/2)) break 
| 
X[i]=Y 
U2 =runif(1) 
if(U2<=1/2) Z[i]=X[i] 
else Z[i]=-X[i] 
} 
Z 
| | 
MEREEN p, ,方差 为 o? 的 正 态 随机 变量 W, REG W = p + oZ 
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还 可 以 用 极 坐 标 法 产生 正 态 随机 变量 . 如 例 4. 14. 
【 例 4.14】 (Box-Muller 变换 产生 正 态 随机 变量 ) 设 不 和 了 是 相互 独立 
的 标准 正 态 随 机 变量 . 令 RR 和 0 表示 向 量 (X,Y) 的 极 坐标 . 即 (图 4-1) 其 变换 





图 4-1 极 坐 标 图 


为 . 
R = +Y, tang = $. 
易 知 和 YY 的 联合 密度 函数 为 
f(x,y) = . (4. 2.2) 
- T 
为 了 确定 R 和 9 的 联合 密度 f(d,9) , 我 们 做 随机 变量 的 变换 如 下 : 
d=x +, 0 = arctan( 2) . 
其 Jaccob 行列 式 为 
od ad 
J= Ox ðy =2, 
a a 
ox öy 


由 (4.2.2) 知 , R° 和 9 的 联合 密度 为 
Kd o=} Lež, O<d<œ, 0<0<2n (4.2.3) 
2 2m 


从 而 知 , R° 和 6 是 相互 独立 的 且 R° 为 均值 为 2 的 指数 随机 变量 , 8 (0,22) 
上 的 均匀 随机 变量 . 
首先 通过 (4.2.3) 产 生 其 极 坐 标 ,然后 变换 到 直角 坐标 就 能 产生 一 对 独 
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立 的 随机 变量 XX 和 了 Y. 其 算法 如 下 : 
Step 1 :产生 随机 数 U, 和 U,. 
Step 2: R’ =- 2log(U,), 0=2"U,. 
Step 3:4 
X= Rcos 8 = V- 2logU, cos(2mD: ) , (4.2.4) 
Y= Rsinb = V- 2logU, sin(27U,). _ 
其 产生 2n 个 独立 的 标准 正 态 分 布 随 机 变量 的 R 程序 为 
boxmuller. exam4_ 14 =function(n) {X=0;Y=0 
Ul =runif( 1) ;U2=runif(1) 
for(i in 1:n) | 
X[i] =sqrt( -2 * log( U1)) * cos(2 * pi * U2) 
Y[i] =sqrt(~2 * log( U1) ) * sin(2 » pi * U2) 
| 
e(X,Y) 
| 
上 述 (4.2.4) 是 著名 的 Box-Muller 变换 ,也 称 为 极 坐标 法 . 值得 注意 的 是 ,使 
用 Box-Muller 变换 (4.2.4) 需要 计算 正弦 和 余弦 三 角 函 数 ,这 是 非常 麻烦 的 . 
此 方法 比较 粗糙 ,其 改进 可 参考 Ross 的 相关 著作 . 
R 软件 为 我 们 提供 了 一 些 常用 的 分 布 ,可 以 求 其 概率 、 分 位 数 以 及 产生 随 
机 数 等 , 见 表 4-3. 

















表 4-3 常用 分 布 在 R 中 的 函数 
二 项 分 布 Binomial size ,prob 
泊 松 分 布 Poisson lambda 
几何 分 布 Ceometric prob 
超 几 何 分 布 Hypergeometric m,n,k 
均匀 分 布 Uniform min ,max 
指数 分 布 Exponential rate 
正 态 分 布 Normal mean ,sd 









Student's t df, ncp 


1 分布 
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分 布 中 文 名 | 分 布 英文 名 
好 分布 Chi-squared chisq df,ncp 
下 分 布 F ~ f dfl ,df2 ,ncp 
柯 西 分 布 Cauchy cauchy location ,scale 
伽 马 分 布 Gamma gamma shape ,scale 
威 布尔 分 布 Weibull weibull shape, scale 
贝塔 分 布 Beta beta shapel ,shape2 ,ncp 





ER 4-3 中 所 列 的 分 布 中 ,参数 ncp 表示 非 中 心 参数 ,默认 为 ncp=0, 表 


示 中 心 分 布 . 加 上 不 同 的 前 级 表示 不 同 的 意义 : 

4 。 表示 概率 密度 函数 或 分 布 律 

p 表示 分 布 函数 F(x) ; 

4 表示 分 布 函数 的 反 函 数 F (u), 即 4 的 下 分 位 数 点 

r ”表示 产生 服从 某 个 分 布 的 随机 变量 . 

例如 : 设 X ~ N(1,4) , 其 密度 函数 为 Kx) =e, M 

V8T 

>dnorm(0 ,mean=1l,sd=2) #RE EKA SO) KE 

>pnorm(5,mean=1,sd=2)  # 求 概率 P|X=<S5| 

>qnorm(0.8) #R b-(-1)(0.8),BD 0.8 分 位 点 

>rnom(m,1,2) ，# 表 示 产 生 m 个 分 布 为 N(1,4) 的 随机 变量 

对 于 其 他 分 布 加 上 不 同 的 前 级 具有 相似 的 含义 .到 目前 为 止 ,我 们 可 以 直 
接 利 用 R 软件 产生 常用 分 布 的 随机 变量 . 





4.3 合成 方法 


假设 我 们 已 有 一 个 有 效 的 方法 来 模拟 具有 概率 函数 |p j> 01 (RE | 
ERAS) ) 的 随机 变量 X,,i = 1,2 的 值 .车 X 的 概率 函数 (或 密度 函数 ) 如 
F: I 
PIX =j} =ap + (1 -a)p” 或 f(x)=afi(x) + (1 - a)f,(z), 
(4.3.1) 
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其 中 0 < a < 1. 那么 令 随机 变量 为 

人 e, 

X,, 以 概率 1 - a， 

则 互 的 概率 函数 由 (4.3.1) 给 出 .这 种 模拟 随机 变量 于 的 方法 称 为 合成 法 . 
模拟 的 算法 如 下 : 
Step 1: 产 生 随 机 变量 X. 
Step 2 :产生 一 随机 变量 X. 
Step 3 :产生 一 个 随机 数 U. 如 果 U < a, £ X = X, ; #' jJ £ X = X,. 
[814.15] 设 随机 变量 XY 的 概率 函数 pj,j =5,6,…,14, 见 表 4-4. 


表 4-4 X 的 分 布 律 





模拟 的 值 的 一 个 直接 方法 是 道 变换 法 ,在 此 用 合成 法 对 的 值 进行 模拟 . 
& p; =0.55p™ + 0. 45p® jj = 5,6,…,14， 其 中 p@ i= 1,2 93 X, W 
概率 函数 , 见 表 4-5、 表 4-6. 


表 4-5 X, 的 分 布 律 





则 
xz- 人 以 概率 0. 55 ， 
X,, IÆ 0. 45. 
模拟 天 的 算法 如 下 : 
Step 1 :产生 一 个 随机 数 U,. 
Step 2 :产生 一 个 随机 数 U,. 
Step 3: 如 果 U, < 0.55, W £ X = 2 Im(5U,) + 5; 否则 令 
X = 2 Int(5U,) + 6. 
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产生 随机 变量 X 的 nr 个 值 的 R 程序 为 : 
comp. exam4_15 =function( n) | 
X=0 
for(i in 1:n) | 
ul =runif( 1 ) ;u2 = runif( 1 ) 
if( ul<0.55) | 
X[i] =2 * floor( 5 * u2)+5 
| 
else X[ i] =2 * floor(5 * u2) +6 
l 
X 
l 
【 例 4.16] 假设 某 台 仪器 出 现 故 障 而 未 能 及 时 发 现 ,或 者 在 某 一 时 刻 仪 
器 受到 外 部 环境 影响 (如 电压 突然 增 大 ) ,致使 这 部 分 观测 值 的 精度 降低 而 误 
” 差 增 大 . 在 大 多 数 情况 下 ,仪器 的 观测 值 服从 正 态 分 布 N(9,0o ), 少数 情形 
下 仪器 的 观测 值 服 从 N(0,=')(o > oo ). 如 何 模拟 出 此 仪器 的 观测 
值 ? 
不 妨 假设 此 仪器 观察 值 的 密度 函数 为 /(x) : 
f(x) = afi(x) + (1 ~ a)f(x), 
其 中 a e (0,1) 由 以 往 记录 确定 , 且 








fila) -大 ee- E), 
AD = 元 -ee[- E2} 


模拟 的 算法 为 
` Step 1: 产 生 服从 NW(b,co。 ) 的 随机 变量 X. 
Step 2: 产 生 服 从 N(0,o2) 的 随机 变量 X. 
Step 3: 产 生 随 机 数 U. 
Step 4: U < a, £ X = X, ; FMS X = X,. 
模拟 此 仪器 n 个 观测 值 的 R 程序 为 
comp. exam4_16 =function(n,a,0,00,0) | 
X=0 
for(i in 1:n)| 
X1 =rnorm(1,0,00);X2=rnorm(1,0,0) 
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! U=runif(1) 
if(U<=a) {X[i] =X1 
j else {X[i] =X2} 


4.4 Poisson 过 程 模拟 


1. FZ: Poisson 过 程 模拟 

假设 要 模拟 速率 为 人 的 Poisson 过 程 的 前 n 个 事件 发 生 的 时 间 . 已 知 在 
Poisson 过 程 中 两 个 相继 事件 之 间 的 时 间 间 隔 服从 参数 为 人 的 指数 分 布 ,从 而 
产生 这 个 过 程 的 一 种 方法 是 产生 出 这 些 间 隔 时 间 . 如 果 产 生 个 随机 数 U, 


U0,,…,0, 并 令 X, =- —logU,, MI X, 就 可 看 做 是 Poisson 过 程 在 第 1- 1 与 第 i 
个 事件 之 间 的 时 间 间 隔 . 因为 第 个 事件 来 到 的 时 刻 等 于 前 /个 事件 的 时 间 间 
隔 之 和 ,所 以 就 得 到 了 前 ”个 事件 来 到 时 间 的 值 为 5 = $, Xj = 1.2, 


现在 要 模拟 Poisson 过 程 在 时 刻 了 前 所 发 生 的 每 个 事件 的 时 间 ,那么 我 们 
也 能 够 按 上 述 方法 产生 相继 事件 发 生 的 时 间 间 隔 且 当 它们 的 和 超过 了 时 就 停 
止 的 方法 进行 模拟 . 令 上 表示 时 间 , 了 表示 到 时 刻 : 发 生 的 事件 数 , SOU) 表示 
最 近 发 生 的 事件 的 时 间 . 则 算法 如 下 : 

Step 1:t=0, I=0. 

Step 2: 产 生 随 机 数 U. 


Step 3: t — t - logU ;车 + > T, 则 停止 . 


Step4:I— I+ 1,S(1) = t. 
Step 5: 返 回 到 Step 2. 
在 上 述 算 法 中 1 的 最 后 一 个 值 表示 到 时 刻 了 时 事件 发 生 的 个 数 , 且 
S(1) ,S$(2),…,S(7) 是 第 7 个 事件 依次 发 生 的 时 间 . 
模拟 参数 为 lambda 的 在 时 刻 了 前 的 Poisson 过 程 状态 的 R 程序 为 : 
pois. procl = function ( T ,lambda) | 
t=0;1=0;S=0 
repeat Í 
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U=runif(1) 
t=t-1/lambda * log( U) 
if(t>T) break 
I=I+1 
S[I]=t 
} 
list(S=S,1=1) 
l 
根据 第 一 章 的 附注 1 可 以 得 到 另外 一 个 模拟 Poisson 过 程 在 7 时刻 前 各 
个 事件 发 生 的 时 刻 的 有 效 方法 . 令 N(T) 表示 到 时 刻 了 所 发 生 的 事件 总 数 . 由 
第 一 章 知 其 算法 如 下 : 
Step 1 :产生 参数 为 AT 的 Poisson 随机 变量 N( T) 的 值 n. 
Step 2: 产 生 (0,7) 上 均匀 分 布 随机 变量 的 =” 个 值 : T, Tats Tu 
Step 3 :将 7T, ,7,,… T, 排序 . 
附注 3 在 此 方法 中 ,车 A 很 大 就 用 例 4. 4 的 方法 产生 NT) 的 值 ,如果 
A 不 大 就 用 例 4.9 的 方法 产生 N(T) 的 值 . 
模拟 参数 为 A 的 在 时 刻 了 前 的 Poisson 过 程 状态 的 R 程序 为 : 
pois. proc2 = function( T , lambda) | 
N=0;S=0 
i=0;p=exp( -lambda * T) ;F=p 
u=runif( 1) 
while(u> =F) | 
p=lambda * T * p/(i+1);F=F+p 


i=i+1 


| 
N=i 
U=runif( N) 
S=sort(T * U) 
list(N=N,S=S) 
l 
也 可 以 利用 R 函数 直接 产生 N(T), 上 述 程序 改写 为 
pois. proc3 =function( T, lambda ) | 
S=0 
N =rpois( 1 ,lambda * T) 
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U=runif( N) 
S=sort( T * U) 
Hst(N=N,S=S) 
l | 
【 例 4.17】 假设 某 银行 的 营业 时 间 为 早上 8:00 到 下 午 5:00 共 9 个 小 
时 ,顾客 按照 参数 为 和 = 3 人 /小 时 的 Poisson 过 程 来 到 银行 . 试用 模拟 的 方法 
得 出 银行 在 某 一 天 来 到 的 顾客 数 和 每 位 顾客 到 达 的 时 间 。 
解 ”可 以 调用 上 述 的 任何 一 个 程序 ,如 调用 第 一 个 : 
>pois. procl (9,3) 
$5 
[1] 0.0192087 0. 2367797 0. 9466212 1. 0905208 1. 7701686 1.7952087 
1. 8244874 
[8] 2. 1662139 2. 6953013 2. 7672339 3. 7728436 3. 7805311 3. 7821376 
4.3271704 
[15] 4.4634007 4. 6937963 5. 1886387 5. 8120959 6. 2018235 6. 2235077 
6.8783518 
[22] 7.1107778 7. 2659268 7. 4430771 7. 5904169 8. 0473991 8. 1961518 
8.2614421 
[29] 8.8433114 
$I 
[1] 29 
2. 非 齐 次 Poisson 过 程 模拟 
假设 我 们 要 模拟 具有 强度 函数 A(1) 的 非 齐 次 Poisson 过 程 在 时 刻 了 前 各 
人 可 用 稀释 法 或 随机 抽样 法 来 实现 . 也 就 是 ,首先 选择 一 个 
A 使 得 A(i) < < T, 产生 出 参数 为 A 的 Poisson 过 程 在 时 刻 了 前 的 事件 


数 ,然后 ama AC 对 所 产生 的 事件 个 数 进行 计数 , 则 被 计数 事件 的 过 程 是 


一 个 具有 强度 函数 A (21) ,0 < 1 << 了 的 非 齐 次 Poisson 过 程 . 由 此 我 们 能 够 得 到 
模拟 非 齐 次 Poisson 过 程 在 时 刻 了 前 各 个 状态 的 算法 : 
Step 1:1=0,7=0. 
Step 2 :产生 一 个 随机 数 U. 
Step 3: t= t — logU ;如 果 + > T, 则 停止 
Step 4: 产 生 一 个 随机 数 U. 
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Step 5:0% U < AWD SII 1,S(1) =: 





Step 6: 返 回 到 Step 2. 
模拟 非 齐 次 Poisson 过 程 在 时 刻 了 前 各 个 状态 的 R 程序 : 
nonpois. thin] = function ( lambdat , lambda , T ) Í 
t=0;I=0;S=0 
repeat | 
U=runif(1) 
t=t-l/lambda * log( U) 
if(t>T) break 
Ul =runif(1) 
if( U1 < =lambdat( t) /lambda) | 
I=I+1;S[I]=t 
| 
l 
list(I=I,S=S) 

在 上 述 步骤 中 , A(t) 是 强度 函数 , A 满足 A(5 < A. 那么 7 最 后 的 值 表 
示 到 时 刻 :事件 发 生 的 个 数 , S(1) ,5(2) ,…,S(7) 是 事件 发 生 的 时 间 . 

WR Al) 在 (0,7) 整个 区 间 上 都 接近 A, Step 5 就 很 容易 实现 , 则 此 算 
法 就 很 有 效 . 在 实际 中 , Al) 在 (0,7) 上 不 一 定 都 接近 于 入 , AAAG) 的 连 
续 性 将 (0,7) 分 为 车 十 个 子 区 间 , 然 后 在 每 个 子 区 间 上 用 这 个 算法 . 也 就 是 ， 
确定 合适 的 k, 令 0=i <t <t, < <t <la ST, AAt An E 
得 

Als) SA, Æ fs<t ,i=1, ,k+l. (4.4.1) 
首先 注意 到 事实 : 

如 果 在 上 e (tat) 时 产生 一 个 具有 速率 和 ;的 指数 随机 变量 X, 使 得 :+ 


X > i, 那么 我 们 可 以 证 明 一 (一! 是 速率 为 A,。， 的 指数 随机 变量 . 
在 区 间 (0,5 ] 上 产生 参数 为 A, 的 齐 次 Poisson 过 程 各 个 事件 的 时 间 ,并 
以 概率 Ma) 接受 . 利用 上 述 事实 及 指数 分 布 的 无 记忆 性 ,可 以 产生 参数 为 A， 


的 Poisson 过 程 在 (t... 6] ,i =2,…,k + 1 上 的 各 个 事件 的 时 间 . 
令 : 表 示 当 前 的 时 间 , J 表示 当前 的 区 间 ( 即 当 志 .1 < r < 时 ,=j ) ,7 表 
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示 事 件 发 生 的 次 数 以 及 5S(1),S(2),…,S(71) 发 生 的 时 间 , 则 产生 非 齐 次 
Poisson 过 程 在 时 刻 了 前 状态 的 算法 为 - 
Step 1;:ż=0, J=1, I=0. 


Step 2: 产 生 一 个 随机 数 U, 3⁄2 X =- logU. 
j 


Step 3; 如 果 1 + X > t, Bk3 Step 8. 
Step 4: t— t + X. 


Step 5 :产生 一 个 随机 数 U. 
Step 6: mg LEAO ， 
À; 


Step 7: 返 回 到 Step 2. 

Step 8 :如 果 J = k + 1, 则 停止 . 

(X-t,+t)à; 
À jei ， 
Step 10 :返回 到 Step 3. 

其 R 程序 为 


nonpois. thin2 = function (laf,T,k,n) | 


@I<—I-+1, S(I = 上 


Step 9: X = t=t,,J—J +|1. 


lamax =function(k,n,a) Í lab=0 
b=seq(0,a,by=a/k) 
for(i in 1;k){ 
# 如 果 by=1/k, 则 有 a*k 个 区间 ,不止 k 个 区 间 ! 
lab[i] =max(laf(seq(b[i],b[i+1],by=(b[i+1]-b[i] )/n) )) 
} 
lab 
l 
la=lamax(k,n,T) 
a=seq(0,T,T/k) 
t=0;I=0;S=0;J=1 
U=rmnif(1);X=-1/la[ J] * log(U) 
repeat | 
while(t+X<=a[J+1])] 
t=t+X;Ul =rumf(1) 
if(Ul<=laf(t)/la[J])| 
I=I+1;S[I]=t 
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| 
U=runif(1);X=-1/la[ J] * log(U) 
| 
J=J+1 
if(J==k+1) break 
X=(X-a[J]+t) *la[J-1]7la[J] 
t=a[ J] 
} ， 
list(I=I,S=S) 
l 
再 注意 到 如 下 事实 : 
如 果 在 时 刻 : 发 生 的 事件 与 * 前 发 生 的 事件 是 独立 的 ,到 下 一 个 事件 发 生 
的 时 间 有 分 布 F, 如 下 : 
F,(x) =P| ARZ s 到 下 一 个 事件 发 生 的 时 间 不 超过 x | 在 时 刻 * 有 事 伴 发 生 | 
=P| 下 一 个 事件 在 时 刻 x + s 之 前 发 生 | 在 时 刻 * 有 事件 发 生 | 
= 中 | 事件 在 时 刻 * 和 x +s 之 间 发 生 | 在 时 刻 * 有 事件 发 生 | 
=P| 事件 在 时 刻 * fx + ZARE ` 由 独立 增 量 性 
=1 ~- Pl 没有 事件 在 时 刻 s 和 x + s 之 间 发 生 | 


=] -~ exp( 一 faoa) 


? 


=1 - exp( - [A(s + y)dy) - (4.4.2) 
H (4.4.2) ARD F, FERIER S, AADA FTE X, , S S, =s, +X,, 
等 等 ,就 可 得 到 各 个 事件 发 生 的 时 间 S ,$,,…. ALE — #h ES SR EE 3 A(t) 
的 非 齐 次 Poisson 过 程 在 时 刻 7 了 前 的 各 个 状态 的 方法 . 
【 例 4.18】 模拟 强度 函数 为 A(i) = — > 0 的 Poisson 过 程 在 前 10 
个 时 间 单 位 的 各 个 状态 . 
由 于 





IRE Day= 人 sd = Log: + x + 5) . 


s + 5 
由 (4.4.2) 知 ， 


s+5 _ x 
s+tx+5 s+x+5 








Fs(x) =1 ~ 
令 w = Fs(x), 则 有 
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sS +x+5' 
即 
_ u(s + 5) 
r= 
其 算法 如 下 : 
Step 1: 产 生 随机 数 U, $ S, = 了 ,i=1 
Step 2: S, > T, 则 停止 ,输出 SS Sa É i- 1. 
Step 3 :否则 产生 随机 数 U, Siei +1 H S, = Sii + Sa tiw 返回 
Step 2. 
其 R 程序 为 
exam. 4. 18 = function( T) | 
I U=runif(1) 
S=5 *UZ(1-U) 
i=1 
repeat | ° 
if(S[i]>T) break 
i=i+1 
U =runif(1) 


S[i]=S[i-1]+U * (S[i-1]+5)/(1-U) 
l 
list(S=S[1:i-1] ,I=i-1) 
} 

调用 函数 exam. 4. 18(10) 得 到 结果 如 下 : 
$s l 
[1] 3.378451 4.997666 
$I : 
[1] 2 


4.5 Markov 链 的 模拟 
在 1.4 节 中 已 介绍 了 Markov 链 的 概念 及 相关 性 质 . 本 节 我 们 将 介绍 如 何 


模拟 一 个 不 可 约 的 已 知 状态 和 转移 阵 的 Markov 链 . 设 不 可 约 Markov $ X = 
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{1X,,n =0,1,…| 的 状态 空间 为 8 HERRER P = (p. )。。。 其 算法 为 
Step 1 :任意 给 定 初 始 值 =x,, x, < 8. 
Step 2: ME X, = x, 的 条 件 分 布 PR =x | 和 = 和 | PE Xp 
AJME xne 从 而 就 得 到 了 此 Markov 链 的 一 个 实现 xo ,xi rE 
[ËI 4.19】 模拟 一 个 具有 状态 空间 8 = ( - = ,om ) 且 转 移 核 


1 5 
z 





的 Markov 链 . 
根据 转移 核 知 X... | =x, = N(0. 5x, ,1), 进而 有 


P,,l< | X, = xo] = [psx |X, =x | Pona {x | X, = xo } dx, =n(ž%,ž) > 


21 
Pos {x | X, = xo | = ..1z | x, = xz po.2 |x, | X, = xo] dx, = N (= STUE 


Ponda | X, = xo| 三 D...1z | X,_, = x,_, | po EA | X, = Xo } dx,_, 





- |P 41) 
2" 273 .4"-! 


可 以 看 出 ,条 件 密度 函数 收敛 到 N(0， $), 表明 此 Markov 链 是 平稳 的 ， 


其 平稳 分 布 为 Mo, ) . 
下 面 我 们 给 出 模拟 此 Markov 链 的 步骤 :首先 确定 初始 值 X。 = 0, 然后 从 
N(0.5x,,1) PEE X, 即 可 得 到 此 链 的 一 个 实现 . 其 R 程序 为 
exam4. 19=function(x0,m)| 
X=x0 
for(iin2:m){ 
X[i] =morm(1,0.5 * X[i-1],1) 
| 
X 


| 
运行 exam4. 19(0 ,1000 ) 就 可 得 到 此 Markov 链 的 一 个 实现 . 

为 了 判断 初始 值 对 Markov 链 的 将 来 状态 的 影响 ,我 们 分 别 到 由 初始 值 
-5,0,5 产生 的 Markov 链 的 三 条 实现 ,作出 图 4-2. 由 图 4-2 可 看 出 ,尽管 此 
Markov 链 的 初始 值 有 很 大 差别 ,但 经 过 一 段 时 间 后 ,其 实现 趋向 于 一 致 . 
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图 4-2 不 同 初始 值 的 Markov 链 的 实现 


练 习 4 
1. 用 逆 变 换 法 编写 产生 下 述 随机 变量 的 程序 ， 
X 0 1 
p |0.4 0.6 


模拟 n = 10000 次 ,并 确定 随机 变量 的 值 为 0 的 比例 。 
2. 用 逆 变 换 方法 生成 如 下 密度 函数 的 随机 变量 ,要 求 写 出 R 程序 ; 


(1) f(x) =E, 2<x<6; 


(2) Ka) = F exp| -Ža -2)] ,>> 2; 
(3) f(x) =4x(1 -2), 0 < x < 1; 

isti = exp(-*) o æ. 
(4) Logistic 分 布 败 z) = — exp( 2) < x < ; 
— 1! 
nll + x?) 


(5) Cauchy 分 布 /(x) = 


x 


(6) Hz) =——, O< x =s1. 


e—- 1 


3. 用 逆 变 换 方 法 生成 如 下 概率 函数 的 随机 变量 ,要 求 写 出 R 程序 : 
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1 
=il=— _ 1-=012 . n: 
(1) PIX =i} T ! ,2 


X 1 2 3 4 5 
(2) 
p 01 02 04 02 0.1 
4. 给 出 产生 具有 以 下 分 布 函 数 的 随机 变量 的 算法 及 程序 : 
F(x)=1 -exp(-ax), 0 < x < œ. 
具有 上 述 分 布 的 随机 变量 称 为 Weibull 随机 变量 . 
5. 用 筛选 法 来 模拟 如 下 密度 函数 的 随机 变量 , f(x) 是 需要 模拟 的 随机 变 
量 的 密度 函数 , g(x) 是 其 对 应 的 筛选 函数 。 — 
(1) f(x)=x(1 -x)，0 <x < 1,， g(x) HEER; 


(2) Aa) = exp( - Fa?) ,ex) < (+ 他 ) 


1 ° 
-— 


(3) f(x) = exp Tz, g(a) ce ets” ; 


(4) f(x) = exp( - Ža?) , x290, g(x) œ zexp| - + (O _ 6°) ] . 


6. 编写 例 4.4 中 用 向 上 和 向 下 搜寻 法 产生 Poisson 随机 变量 的 程序 ,并 在 
À 较 大 时 ,比较 它们 的 运算 效率 . 

7. 令 X 是 一 个 均值 为 1 的 指数 随机 变量 . 给 出 一 个 有 效 算 法 来 模拟 一 个 
随机 变量 ,其 分 布 函 数 为 给 定 < 0.05 条 件 下 的 X 的 条 件 分 布 . 也 就 是 它 的 
密度 函数 为 


f(x) = 0 < x < 0.05. 


产生 100 TAFRANI ELX |X < 0.051. 
8. 给 出 模拟 一 个 具有 概率 函数 已 ，j = 5,6,…,14 的 随机 变量 的 方法 ,其 
中 
_ 0. 11 , 当 了 是 奇数 且 5 < ;j=< 13, 
P= 和 0 09 当 ?是 偶数 6 < < 14. 
9. 假设 随机 变量 工分 别 依 概率 0. 06 ,0. 06 ,0. 06 ,0. 06 ,0. 06 ,0. 15 ,0. 13, 
0. 14 ,0. 15 ,0. 13 取 值 1,2 ,… ,10. 用 合成 方法 产生 的 值 . 
10. 给 出 产生 具有 下 述 密 度 函 数 的 随机 变量 的 两 种 算法 ; 
f(x)= xe™, Osr< œ, 


并 比较 其 有 效 性 . 
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11. 假设 要 通过 具有 速率 A 的 指数 筛选 法 来 产生 密度 函数 如 下 的 随机 变 
EX: 


fG)= ee, z > 0， 


那么 确定 À 的 值 使 得 用 来 产生 X 的 此 算法 的 迭代 步 数 的 期 望 值 最 小 . 

12. 给 出 产生 具有 下 述 密度 函数 的 随机 变量 的 一 种 算法 : 

f(x) =30(x — 2x' + xt), 0 三 yx 三 1， 
讨论 此 算法 的 有 效 性 . 

13. 一 个 意外 伤亡 保险 公司 有 1000 个 客户 ,每 个 客户 独立 地 在 下 个 月 以 
概率 0. 05 索赔 . 假设 索赔 量 是 独立 的 具有 均值 $ 800 指数 随机 变量 . 用 模拟 
方法 估计 这 些 索赔 量 的 和 超过 $ 50000 的 概率 . 

14. 为 了 完成 一 项 工作 ,一 个 工人 必须 要 依次 经 过 上 个 阶段 . 完成 阶段 i 
的 时 间 是 具有 速率 A,,i = 1,2,…,&k 的 指数 随机 变量 ,那么 在 完成 阶段 i 后 ,此 
工人 以 概率 a;,i=1,2,…,k -1 进入 到 下 一 个 阶段 .也 就 是 ,在 完成 阶段 i 后 ， 
此 工人 以 概率 1 - a 停止 工作 . 如 果 我 们 令 并 表示 此 工人 用 在 工作 中 的 时 间 
量 , 那 么 就 称 为 Cox 随机 变量 . 写 一 个 产生 此 随机 变量 的 算法 . 

15. 公共 汽车 按照 每 小 时 5 辆 的 Poisson 过 程 到 达 一 个 运动 会 场所 . 每 辆 
公共 汽车 等 可 能 地 包含 或 者 20 ,或 者 21 ,… ,或 者 40 个 运动 爱好 者 ,在 不 同 的 
公共 汽车 中 运动 爱好 者 的 人 数 是 独立 的 . 写 一 个 算法 来 模拟 到 时 刻 上 = 1 时 这 
些 运 动 爱 好 者 的 到 达 人 数 . 

16. (1) 写 一 个 用 稀释 法 产生 具有 如 下 强度 函数 的 Poisson 过 程 的 前 10 个 
时 间 单 元 的 程序 : 


A(t)=3+—— 二 t; 
(2) 对 上 述 例子 给 出 一 个 改进 了 的 稀释 法 的 算法 . 
17. 假设 Poisson 过 程 的 强度 函数 为 
t 
A(t) = 5? 
1+5(t-—-5), 5<t< 10. 
模拟 此 Poisson 过 程 在 10 个 单位 时 间 前 发 生 的 各 个 事件 的 时 间 . 
18. 模拟 一 个 具有 状态 空间 8 = ( - wm ,o ) 且 转 移 核 


xa; 
一 j 
P; = x,e 


0 <t <5, 


的 Markov 链 . 
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估计 精度 与 有 效 模拟 次 数 


在 统计 学 中 ,通过 对 实际 问题 进行 观测 得 到 若干 值 后 ,就 要 对 我 们 所 感 兴 
趣 的 未 知 参数 9 进行 估计 ,但 往往 达 不 到 指定 的 精度 ,这 时 就 需要 再 进行 大 量 
的 抽样 . 为 了 避免 大 量 抽样 带 来 的 困难 ,这 时 就 需要 进行 计算 机 模拟 . 通过 模 
拟 可 以 确定 在 一 定 的 信和 度 下 要 达到 指定 的 精度 所 需要 抽样 的 容量 . 下 面 就 对 
这 些 内 容 进 行 介绍 . 


5.1 总 体 均值 和 总 体 方差 


假设 X, ,X,,… X, 是 独立 同 分 布 的 随机 变量 . 令 9 和 o° 分 别 表示 其 均值 
和 方差 , 即 , 9 = E[X,] UR o? =Var(X,). + X = Y, 并 表 示 这 个 数据 的 算 


7 
术 平均 值 , 也 称 为 样本 均值 . 当 总 体 均值 9 未 知 时 ,我 们 经 常用 样本 均值 对 之 
进行 估计 . 易 知 EX- 03 ELC- 0)”] =T 当 多 很 小 时 , 它 表明 匀 是 9 的 
一 个 好 估计. 

由 于 总 体 方差 o? 通常 是 未 知 的 ,所 以 很 难 直接 用 的 值 作为 衡量 ”个 


数据 的 样本 均值 估计 总 体 均值 的 误差 标准 ,从 而 需要 估计 o°. 我 们 往往 用 样 
本 方差 


1 
n-i 





S= Y (x, - X)? 


估计 o? ,而 且 易 知 ES =0°. 有 时 用 样本 标准 差 S 作为 总 体 标准 差 e 的 估计 ， 


或 者 用 样本 标准 误差 s 作为 总 体 标准 误差 £ 的 估计 . 

假设 已 经 拥有 若干 个 X, 的 值 ,如 果 我 们 的 目标 是 估计 9=E[X,] , 并 且 要 
保证 在 给 定 的 置信 度 1 - a 下 达到 指定 的 精度 ,那么 我 们 将 要 产生 多 少 新 数据 
呢 ? 解决 此 问题 的 方法 是 ,首先 选择 一 个 合适 的 正 数 d, 例如 ,如 果 d 是 估计 
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量 式 的 标准 差 ,我 们 能 够 以 95% 的 可 靠 性 确定 与 9 的 差 不 超过 1.96d. 我 们 
将 继续 产生 新 的 数据 ,直到 产生 了 "个 数据 的 信使 得 其 样本 标准 误差 记 < d. 


确定 何 时 中 止 产生 新 数据 的 算法 如 下 : 
Step 1: 选 择 一 个 合适 的 值 d 作为 估计 量 的 标准 误差 . 
Step 2: 至 少 产生 100 个 数据 . 


Step 3 :继续 产生 新 的 数据 , 当 达 到 个 数据 且 r: < d 时 停止 ,其 中 5 是 根 
据 这 上 个 数据 确定 的 样本 标准 差 . 
Step 4: 0 的 估计 量 为 X= Y. ži, 


[815.1] 连续 产生 标准 正 态 随机 变量 直到 ”个 为 止 ,其 中 > 100 且 满 


B= < 0.01, 其 中 5S 是 此 个 数据 值 的 样本 标准 差 . 问 n 为 多 少 ? 


我 们 编写 程序 如 下 : 
exam5. 1 = function( d) | 
X =rnorm(100) ;k =100 
while( sd( X) /sqrt(length(X))>=d)] 
k=k+1 
X[k]=rnorm(1) 


k-1 
} 
并 调用 exam5. 1(0.01) ,就 可 得 到 n = 9956. 


因为 上 述 算法 对 每 次 产生 的 新 数据 都 需要 重新 验算 — < d, 这 样 就 会 影 


响 运算 速度 ,我 们 对 此 算法 进行 改进 . 
考虑 序列 X, ,下 2 9 并 令 


以 及 


i=l j- 1 
分 别 表示 前 7 个 数据 的 样本 均值 和 样本 方差 .下 述 递归 方法 用 来 连续 地 计算 
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样本 均值 和 样本 方差 的 流动 值 . 
$S =0, 志 -=0. 
K. = X + a 3, 
ja = A; + j+r1l (5.1.1) 
32 =(1 - S? + (j + 1)(X,,, - X). (5.1.2) 
J 


[815.2] ( 续 例 5.1) 用 改进 了 的 算法 对 例 5.1 进行 编程 : 
exam5. 2 = function ( d ) | 

X =rnorm( 100) ;k= 100 

ss=0;xbar=X[1] 

# 下 面 的 for 循环 产生 前 100 个 均值 和 方差 

for(j in 1:(k-1)): 
xbar[j+1]=xbar[j]+(X[j+1]-xbar[j])Z(j+1) 
ss[j+1]=(1-1⁄/j) *ss[j]+(j+1) * (xbar[j+1]-xbar[;])° 


# 下 面 的 repeat 循环 通过 递归 来 产生 100 个 数据 以 后 的 均 
值 和 方差 
repeat | 
k=k+1 
X[k] =rnorm(1) 
xbar[ k] =xbar[k-1]+(X[k]-xbar[k-1])Zk 
ss[k]=(1~1/(k-1)) *ss[k-1]+k * (xbar[k]- 
xbar[ k-1])’ ， 
if( sqrt( ss[ k ] )/sqrt( length( X) ) <d) break 
| 
list( xbar= mean(X),N=k,Var=ss[k]) 
} 
通过 运行 下 述 程序 测算 , 
>system. time( exam5.1(0.01)) 
用 户 系统 流逝 
3.78 0.00 3.86 
> system. time( exam5.2(0.01)) 
用 户 系 统 流逝 
2.67 0.00 2.70 
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对 同样 的 精度 d = 0.01, 例 5.2 比例 5.1 快 将 近 30%. 
如 果 随 机 变量 的 方差 是 其 期 望 的 函数 ,例如 Bernoulli( 或 0-1) 随 机 变量 ， 
模拟 时 对 上 述 算法 就 需要 修正 . 即 ,假设 产生 随机 变量 下 使 得 
x -人 以 概率 p， 
0, 以 概率 1 - p, 
并 假设 我 们 对 估计 5 感 兴趣 . 因为 Var(X,) =p - p), 所 以 不 必 利 用 样本 方 
差 估计 Var(X,). 很 自然 地 ,方差 Var(X,) 的 估计 为 (1 - X,). 对 此 ,我 们 用 
下 述 方法 确定 何 时 停止. 
Step 1 :选择 一 个 合适 的 4 作为 估计 量 的 标准 误差 . 
Step 2: 连 续 地 产生 新 的 数据 ,直到 产生 上 个 数据 使 得 [22(GL -2)] ”< 
d 时 就 停止 . 
Step 3: 计 算 p 的 估计 量 X,- 
【 例 5.3】 假设 抛 一 枚 硬币 ,出 现 “ 数 字 ” 的 概率 为 p, 当 抛 了 10 次 时 ,出 
现 “ 数 字 ”6 次 . 问 至 少 还 需要 抛 多 少 次 才能 使 得 p 的 估计 的 精度 达到 0.017 
令 X,=1 表示 抛 第 i 次 硬币 时 出 现 的 是 “数字 ”, X, = 0 表示 抛 第 i 次 硬币 
时 出 现 的 是 “ 花 ”. EAR PIX = 1] =p. 其 R 程序 为 
exam5. 3 = function( d ) | 
X=rep(1,6) 
X[7:10] =0 
X[11:100] = sample(ec(0,1) ,90,prob =c(0.4,0.6) ,replace = 
TRUE) 
k=100 
while( sqrt( mean( X) * (1—mean( X) )Zk)>d) Í 
k=k+1 
X[k]=sample(c(0,1),1,prob=c(0.4,0.6)) 
| . 
list( N=k-1-10,X=X) 
| 
运行 程序 exam5.3(0.01) 得 到 至 少 还 需 抛 2371 次 才能 达到 精度 0.01. 


5.2 总 体 均值 的 区 间 估 计 


ER X, ,X,,… ,X, 是 来 自 于 一 个 总 体 均值 为 9 .方差 为 o? 的 简单 随机 样 
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本 . 尽管 样本 均值 是 9 的 一 个 有 效 点 估计 ,但 我 们 不 能 认为 了 就 是 9 通常 
合理 的 考虑 是 根据 不 构造 一 个 合适 的 区 间 来 覆盖 0. 


为 了 得 到 这 样 一 个 区 间 ,需要 估计 量 天 的 (近似 ) 分 布 . 由 中 心 极限 定 
理 知 ,对 充分 大 的 n, 有 | 


m52 L N(0,1)， 


其 中 ` N(0,1) 意 指 “ 近 似 服 从 标准 正 态 分 布 ”. 另外 ,如 果 用 5S 来 替换 未 知 的 
标准 差 o, 那么 样本 均值 仍然 服从 渐 近 正 态 分 布 . 当 充分 大 时 ， 


mA 2 NCO0,1). (5.2.1) 


由 (5.2.1) 知 ,9 的 置信 度 为 1 -a WEAKHH E +z 

现 考虑 在 一 个 模拟 过 程 中 ,要 产生 新 的 数据 , 问 什 么 时 候 停止 产生 新 的 数 
据 ? 解决 此 问题 的 方法 是 首先 选择 a 和 L, 并 继续 产生 数据 直到 6 的 置信 度 
为 1 - e 的 轩 信 区 间 长 度 2 CHEN L 其 算法 如 下 

Step 1 :至 少 产 生 100 个 数据 . 

Step ? :连续 地 产生 数据 , 真 到 产生 的 数据 的 个 数 使 得 28 让 < 1, 其 中 
S 是 由 这 上 个 数 产生 的 样本 标准 差 ， 

Step 3 :如果 元 和 * E X M S 的 观察 值 , 则 8 的 置信 度 为 1 - a 的 区 间 估 计 

一 S 
为 x TK. 

[915.4] 在 用 平均 值 法 估计 下 时 , 即 估计 积分 | Vi de, 构造 一 个 
长 度 小 于 0.01 的 区 间 使 此 区 间 以 95% 的 可 靠 性 包含 r, 问 至 少 需要 模拟 多 
少 次 ? 

编写 程序 如 下 : 

exam5. 4 = function( alpha ,1) | . 
ssM=0;x=runif(100);k=100 # ssM 是 M 的 样本 方差 
M=sqrt(1-x2);Mbar=M[1] 
for(i in 1:(k-1))1 

Mbar[ i+1 ] =Mbar[i] +(M[ i+1] —Mbar[i])Z(i+1) 
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ssM[i+1]=(1-1/i) *ssM[i]+(i+1) * (Mbar[i+1]-Mbar[i])° 
| 
repeat | 
k=k+1 
x[k] =runif(1) 
M[k]=sqrt(1—x[k]2) 
Mbar[ k ] =Mbar[ k-1]+(M[k]-Mbar[ k-1])/k 
ssM[k]=(1-1/(k-1)) + ssM[k-1]+k * (Mbar[ k ]-Mbar[k-1])’ 
if(8 * qnorm(1-alpha/2) * sqrt(ssM[k] )Zsqrt( k)<1 ) break 
| 
list(low=4* (mean( M)— qnorm(1-alpha/2) * sqrt(ssM[k])Zsqrt(k)), 
upp =4 * (mean( M) +qnorm( 1—alpha/2 ) * sqrt( ssM [ k ] ) /sqrt 
(k)),N=k,Pi=4 * mean( M) ) 
l 


5.3 Bootstrap 方法 


RAS k X HAARA Fa) 未 知 ,其 观察 值 是 X, = x. i= 1 „2, .n. 
一 般 通过 经 验 分 布 函 数 F. 估计 分 布 函 数 F, 其 中 
F.(x) = 二 和 < x,i=1,2,- n] ,# 表 示 对 i 的 计数 . 
注 :符号 “各 在 公式 中 ,表示 计数 ,在 程序 中 ,表示 对 该 语句 的 注释 . 以 后 


AAH. 
我 们 也 可 以 将 F, 看 做 是 一 个 离散 随机 变量 X, 的 分 布 函数 , 即 表 5-1. 








如 果 x, 有 相同 的 值 ,我们 将 对 应 的 概率 合并 ,例如 , x, = 0,x, = x, =2, 那 么 
1 2 | 
PIX, = 0| = 本 ,PIT = 21 = 


假设 我 们 对 分 布 函数 F 的 参数 0( F) 感 兴趣 . 例如 , 0( F) 可 能 是 下 的 均 
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值 ,或 者 中 位 数 ,或 者 任何 其 他 参数 . 又 假设 用 来 估计 0( F) 的 统计 量 z(X,, 
Xt X.) 已 经 给 出 ,为 了 判断 eX, X,,… , X.) 的 精度 ,我 们 要 估计 其 均 方 
RÆ. 即 

MSE(F) = Es[(g(Xi,X,,,X,) - 0(F))°] 


特别 , 当 OCF) = E[X], B g(X,,X,,--,X,) = 文 时 立刻 得 到 MSE 的 一 个 估计 
RAŽ. 而 一 般 情形 下 , CF) 为 X 的 中 位 数 时 ,其 均 方 误差 的 形式 不 明显 ， 


那么 我 们 用 Bootstrap 方法 对 此 均 方 误差 MSE 进行 估计 . 

我 们 知道 ,如果 分 布 函数 下 是 已 知 的 ,在 理论 上 就 能 够 计算 出 0 的 估计 量 
的 均 方 误差 . 若 分 布 函 数 下 未 知 ,由 Glivenko-Cantelli 定理 知 , 当 充分 大 时 ， 
F, 以 概率 1 一致 收敛 到 F. 

LE 6 是 分 布 函数 眉 的 一 个 连续 函数 , 则 

MSE(F.)=E,[(g(X,,X,,--,X.) - 0(F,))°] (5.3.1) 
近似 地 等 于 MSE(E). 在 (5.3.1) r X, 被 看 做 是 具有 分 布 函数 F. 的 相互 独 
立 的 随机 变量 . MSE(F,) WA MSE(F) 的 Bootstrap 估计 . 


当 用 样本 均值 来 估计 总 体 均值 时 ,其 均 方 误差 为 E[ (X - 0)?] = 所. 因为 
a? 未知, 我 们 很 自然 地 用 样本 方差 对 之 进行 估计 ,也 就 是 ,样本 均 方 误差 
MSE(F) 的 估计 为 三. 

如 果 用 Bootstrap 法 ,我 们 对 样本 均 方 误差 就 用 下 式 来 估计 ; 

MSE( F.) =E, [( y 和 = _ z) ] . 
BER X, Xa, X, 是 相互 独立 的 服从 分 布 F. 的 随机 变量 因为 
E [$ Š] = BC] ==, 
又 因为 ü 
Var, (X) = En [(X ~ E, [X])2] = E L (X - 2] = 二 | > (a - 习 ?| ， 


所 以 


n 


" X. Var, ( X) > (x, - x)? 
MSE(F,) = Var, [ y =) = 一 一 一 = 一 -一 一 一 


n n 
由 此 知 , 当 用 样本 均值 估计 总 体 均 值 时 ,Bootstrap 法 是 没 必 要 的 . 但 为 了 看 出 
Bootstrap 方法 的 有 效 性 , 现 给 出 一 个 实例 进行 验证 :假设 有 100 个 数据 来 自 标 
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EESHA X , 现 利用 这 些 数据 用 Bootstrap 法 估计 随机 变量 的 期 望 = EX. 


由 理论 分 析 知 , X 是 9 的 估计 , 且 EX =0, 久 的 标准 误差 为 sd(X) = 
一 1 、 
Var(X) -7 而 = 0.1. 首先 利用 R 生产 这 些 数据 . 
>gauss=rnorm(100) 
再 进行 Bootstrap 抽样 
>boot=0 
>for(i in 1:1500)1 
boot[ i] =mean( sample( gauss , replace =TRUE ) ) 
l 
现在 计算 出 其 均值 和 标准 误差 : 
>mean( boot) ;sd( boot) 
也 可 采取 直接 计算 方法 : 
>mean( gauss) ;sd( gauss )/sqrt( 100) 
现 把 它们 的 结果 列 人 表 5-2. 


表 5-2 








但 是 Bootstrap 法 不 是 为 了 提高 估计 量 的 精度 ,而 是 一 般 用 来 对 估计 量 的 
方差 进行 估计 . 车 我 们 所 感 兴趣 的 参数 0( F) 是 分 布 的 方差 , 则 其 估计 量 为 


OCF.) = Var, (X) = Y” G 


i=l n 
我 们 首先 考虑 
MSE(F.)= E, [(g(X,,X,,---,X,) ~ 0(F,))°]. 
而 
[g(z xa," mi) = 0(F,)]° 


MSE(F) = X} l ———,L,. 


n 
Hh, EA i Om 1 ajn, 所 以 MSE(F,) 通常 要 求 计算 n 个 和 式 , 当 n 很 大 
时 ,这 是 一 个 天 文 数字 . 
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要 克服 上 述 问题 ,首先 产生 ”个 相互 独立 且 具 有 分 布 函数 F. 的 随机 变量 
Xi „X, eX, 令 
| Y, =[g(Xi,X,' eX) - 0(F,) ]°. 
接着 产生 第 二 组 随机 变量 X, X oX, 并 计算 
Y, = [g (XiX X.) -OCF T. 
等 等 ,直到 收集 到 变量 Y, Y, e, Ys AAR Y, 是 相互 独立 的 ,有 均值 


MSE(F,), 所 以 我 们 能 够 用 其 平均 值 Y” 天 作为 MSE( F.) 的 估计 量 . 


[615.5] 如 果 已 知 某 随机 变量 并 的 15 个 观测 值 如 下 : 
5,4,9, 6, 21, 17, 11, 20,7, 10, 21, 15, 13, 16, 8. 
试用 Bootstrap 法 估计 Var(X) 及 Var(S ) , 其 中 S° 为 样本 方差. 
我 们 用 如 下 R 程序 就 可 得 到 其 估计 : 
X 表示 已 知 观测 样本 ,pr 为 X 对 应 的 经 验 概率 分 布 ,fboot 是 统计 量 表达 
式 ,B 为 重复 抽样 次 数 . 
boot =function( X ,pr,fboot, B) Í 
Tboot=0 
for(i in 1.B)1 
Y =sample( X ,length( X) , prob = pr , replace = TRUE) 
Tboot[ ij =fboot( Y) 
l 
Tboot 
l 
X=c(4 ,5,6,7,8,9 ,10 ,11 ,13, 15, 16 ,17, 20, 21) 
pr=c(1/15,1/15,1/15,1/15 ,1/15 ,1/15 ,1/15 ,1/15 ,1/15 ,1/15 ,1/15, 
1/15 ,1/15 ,2/15) 
调用 程序 
>T=boot(X, pr,var,100) 
>mean( T) 
>var( T) 
得 到 Var(X) 及 Var(S2) 的 估计 值 分 别 为 32.925 和 53.957. 


练 >J 5 
1. 连续 产生 指数 分 布 (1) 的 值 直到 n 个 为 止 ,其 中 = 100 满足 三 < 
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0.01, 5 为 此 个 数据 的 样本 标准 差 . 问 : 
(1) n 至 少 为 多 少 ? 
(2) 样 本 均值 和 样本 方差 各 为 多 少 ? 它们 与 理论 值 有 何 差 别 ? 


2. 根据 产生 的 随机 数 估计 [exp(?) dx 要 求 至 少 产生 100 个 随机 数 , 直 


到 估计 量 的 标准 差 小 于 0.01 为 止 . 
3. 证 明 : :如 果 我 们 增加 随机 数 直到 其 和 超过 1 , 则 期 望 增加 的 数 等 于 e. 也 
就 是 ,如 果 


N= minfn: Y U, > 1}, 
WJ E[ N] = e. 
《1) 用 上 述 方法 估计 。, 并 模拟 1000 次 . 
(2) 估 计 (1) 中 给 出 的 估计 量 的 方差 ,并 给 出 。 的 置信 系数 为 0.95 的 区 
间 估 计 . 
4. 考虑 一 个 随机 数 序列 并 令 M 表示 首次 小 于 前 面 的 数 的 下 标 . 也 就 是 
M = min[n:U, < U, < --- < U, > U.1. 


(1) 论 证 PIM > n] = n > 0; 


(2) 用 等 式 E[M] = Y PIM > n] 证 明 ELM] =e; 


(3) 用 (2) 来 估计 6, 做 1000 次 模拟 ; 
(4) 估 计 (3) 中 的 估计 量 的 方差 ,并 给 出 。 的 置信 系数 为 0.95 的 区 间 估 
计 . 
5. 在 用 随机 投 点 法 估计 z 时 ,做 多 少 次 模拟 才能 获得 一 个 长 度 小 于 0.1 
的 区 间 , 使 之 以 95% 的 可 靠 性 包含 n? 
6. 为 了 估计 ELX] , Xi, Xa, Xu 已 经 被 模拟 出 ,其 数据 如 下 : 
10,11,10.5,11.5,14,8,13,6,15,10,11.5,10.5,12,8,16,5. 
再 根据 这 些 数据 ,如 果 我 们 要 使 E[X] 的 估计 量 的 标准 差 小 于 0.1, 大 概 还 需 
要 运行 多 少 次 ? 
7. 为 了 估计 0, 产生 了 20 个 相互 独立 的 具有 均值 9 的 随机 数 ,其 值 如 下 ; 
102, 112, 131, 107, 114, 95, 133, 145, 139, 117, 
93, 111, 124, 122, 136, 141, 119, 122, 151, 143. 
如 果 要 确定 9 的 置信 系数 为 0.99 长 度 为 1 的 8 的 最 终 估计 量 ,另外 还 需要 产 
生 多 少 个 随机 数 ? 
8.% X, ,X,,--- ,X, 是 相互 独立 同 分 布 的 随机 变量 ,有 未 知 均值 人 对 给 定 
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的 常数 ”< b, RIH p= Pla < Y&p < b} 感 兴趣 . 


i=] 


(1) 解 释 如 何 用 Bootstrap 法 估计 上 p ; 

(2) 如 果 n=10, H X, WAX 56,101 ,78 ,67,93 ,87,64,72,89,69, 求 p 的 
估计 值 , 取 a=-5,b=5. 
9. 如 果 n =3,X =1,%, =3,X =2, 令 S22 
则 Var(5) 的 Bootstrap 估计 是 什么 ? 

10. 如 果 从 某 分 布 中 抽取 出 的 样本 观测 值 如 下 :16 ,17,20 ,26,22 ,25 ,23 ， 
25,18,17,22,23,19,20,19,21,12,18,17,14, 共 有 20 个 数据 , 则 Var( S°) 的 
Bootstrap 估计 是 什么 ? 
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EMAA N RE 8L2E Et X RE o = EX 的 模拟 过 程 中 ,我 们 是 连续 地 
产生 = 个 独立 同 分 布 的 随机 变量 X. ,X,,… ,X,, 对 与 9 的 偏差 为 X 的 标准 误 
差 = 是 否 可 以 改进 模拟 方法 ,使 其 标准 误差 更 小 呢 ? 本 章 各 节 内 容 就 是 对 


这 个 问题 的 具体 回答 . 
6.1 对 偶 变量 法 


假设 我 们 对 估计 9 = EL X] 感 兴趣 ,又 假设 产生 了 同 分 布 且 具有 均值 9 的 
随机 变量 X,， 和 XX,, 则 


va [2 +2) =-[Var(X,) + Var(X,) + 2Cov( X, ,X,) ]. 


# X, ft X, 是 负 相关 的 , 则 va: [2 + 2] < —-[Var(X,) + Var(X,)] , 即 ,在 
某 种 意义 上 说 ,方差 减 小 了 , 也 就 是 ,估计 的 精度 得 到 提高 , 而 仍然 有 


一 于 = 9 下 面 的 定理 将 会 告诉 我 们 如 何 改 进 模拟 方法 来 所 高 估计 的 精 


E. 
定理 6.1 WRX, ,X,, X, 相互 独立 , 则 对 任何 元 增 函 数 和 和 Ee, 
E[f(X)g(X)] > E[f/(X)]E[z(X)], (6.1.1) 
HP X = (X,X,X). 
证 用 归纳 法 证 明 . 当 n = 工时 , 令 / 和 8 为 单 变量 增 函 数 . 则 对 任意 的 x 
和 yy, HAE x> y(x = y) 则 这 两 个 因 式 都 是 非 负 的 ( 非 正 的 ) , 故 
[f(x) -fOy)][g(x) -8(7)] > 0. 
从 而 ,对 任意 的 随机 变量 正和 了 ， 
[f(X) -~- AY)JLe(X) - g(Y)] > 0, 
蕴涵 着 
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E[/(X) -A(Y)][g(X) - g(Y)] > 0. 
上 式 等 价 于 
E[f(X)g(X)] + E[/(Y)z(Y)] > E[f(X)g(Y)] + E[f( Y)e (X) ]. 
如 果 假 设 世 和 了 了 是 独立 同 分 布 的 ,那么 在 此 情形 下 ,就 有 
E[f(X)g(X)] =E[/(Y)g(Y)], 
E[/(X)g(Y)] =E[f/(Y)g(X)] =E[/(X)]E[eg(X)], 
我 们 获得 了 n = 1 的 结果 . 
假设 (6.1.1) 对 nn -1 时 成 立 , 现 在 假设 X,,X,,… ,X, 是 相互 独立 的 ,f 和 
g 是 增 函 数 . 则 
E[/(X)g(X) | X,= x, ]= EX, Xart Xni sx BK Xart X. x.) | X. = x,] 
= E[/(X, ,X,,--- Xn x. E(X Aar Ann) ] (由 独立 性 ) 
SEX, ,X,,--- Xni x.) ]E[zg(X,,X,,.:- X... n) ]( ERE) 
= EX) | X, = x,]E[zg(X) | X, = x,]. 
从 而 
E[/(X)g(X)|X,] > ELX) | X.]E[g(X) | X.], 
对 上 式 两 边 取 期 望 得 到 
E[f(X)g(X)] > E[E[/(X) | X.]E[g(X) | X.]] > E[f(X)]E[g(X)]. 
FE — SF SF ES ELX) | X.] 和 ELg(XX) | X. ] 都 是 X, 的 单 
调 增 函数 ,因此 由 n = 1 的 结果 有 
E[E[/(X) | X. ]E[g(X) | X.]] z ELE[/(X) | X.]]E[E[g(X) | X.]] 
=E[/(X) ]E[z(X)]. 
推论 6.1 如 果 h(x,,z,," x.) 是 其 每 个 自 变量 的 单调 函数 , 则 对 独立 
随机 数 的 集合 UV, ,U,,…,U,, 有 
Cov[h(U,,U,,-- U.) hl - U,,1 - U, 1 - U,)] = 0. 
证 不 失 一 般 性 ,假设 疡 是 其 前 r 个 自 变量 的 增 孙 数 ,是 后 m-r 个 自 变量 
的 减 函 数 . 从 而 < 
J(x oa = 天 (xx 
VACIA TO )=—- h(1 -Xi — Xs XX TO 
已 知 f 和 g 都 是 增 函 数 . 因此 ,根据 上 述 定理 
Cov[f(U,U,,,U,),g(U,U,,…,U,.)] > 0, 
或 者 等 价 地 ， 
Cov[h(Ui,U,,,U,,l - U... 1 - U), 
h(i -Ul -Ul - U,, U, U,)] < 0. 
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此 结果 成 立 是 因为 随机 向 量 有 1 , U, ,UD ,hl -0,1 -UVU,,…,l = U) 

有 与 下 述 随机 向 量 相同 的 联合 分 布 : 
pi-D1 - U), 
h(1-U,,1 -Ul - U,,U, 33t, U). 

D) 

如 何 产生 X, 和 X, 是 负 相 关 的 呢 ? 根据 上 述 定理 ,我 们 按 下 述 方法 来 进 

fr Rut X, 是 m 个 随机 数 的 函数 , 即 假设 X= h(U ,UV,,…,U,), 其 中 U, 

Ur, Un 是 m 个 相互 独立 的 随机 数 . 令 随 机 变量 X, = h(1 -Ui,l - U,,…， 


1 - U,). 易 知 0 与 1-U 同 分 布 , 且 Cov(U,1 — U) s- 如 果 记 是 每 个 坐标 
的 单调 函数 ,那么 X, 与 X, 是 同 分 布 且 负 相关 的 . 称 此 随机 变量 X, X X, 的 对 


偶 变 量 ( antithetic variable). 据 此 ,我 们 可 以 看 到 此 方法 有 两 大 好 处 ;不 仅 使 
最 终 的 估计 量 有 更 小 的 方差 ,而 且 也 节省 了 产生 第 二 组 随机 数 的 时 间 . 


【 例 6.1】 假设 要 估计 6 = Í sd =e -1, 如果 是 独立 地 产生 2 个 随机 数 
UV,U,, 则 估计 的 方差 为 


U. Ui 
var( se) = Var(e ') = 0. 1210. 
2 2 


其 标准 差 为 V0. 1210 = 0. 34785. 
AAKS hu) =e" (0,1) 上 显然 是 一 个 单调 递增 函数 ,用 对 偶 变量 法 
产生 的 UV 和 1 -UV 的 方差 为 
U el Varl(e’) Cov(e’,e!'’) 
Wi i t 





= 0. 0039, 


标准 差 为 V0. 0039 = 0. 06245. 精度 提高 了 82%. 
【 例 6.2】 $X i= 1,2,…,5 是 均值 为 1 的 独立 的 指数 随机 变量 ,模拟 
估计 


0= P| Yx, > 21.6]. 


i=l 


如 果 直 接 产生 2n 组 指数 随机 向 量 ( A,X X) ,i = 1,2,…,2n, S 
i LED > 21.6, 
loan. 

通常 用 1 = > 入 对 9 进行 估计 . 而 El, = 0, Var(1,) = 0(1 - 0), Var(1,) = 
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“= 9) g T, 的 方差 . 若 用 对 偶 变量 法 对 0 进行 估计 ,我们 按 如 下 方式 产生 


2n 组 随机 数 : 
Ut ,U,*, e, Ui, k =1,2, 2n, 其 中 *=1 -UY ,i=1,2,.…,5. 
& Xt =- log(U;*). 


; r = 21.6, 
0 ,否则 . 
2n I. _ 2n L 
BAES z570 我 们 仍然 用 1, = > zX 0 WTA. EDAR 1, EREN 


的 单调 递增 函数 , 1, 的 方差 小 于 的 方差 . 我 们 用 下 述 程序 进行 验证 . 第 一 个 
程序 为 直接 法 ,第 二 个 为 对 偶 变 量 法 . 
exam6.2_1 =function(n) | 
X=matrix(0,nrow=n,ncol=5) 
k=0 
for(iin 1:n)| 
for(j in 1:5)Í 
U=runif(1) 
X[i,j]=-log(U) *j 
| 
if(sum( X[i,])>21.6)1 
k=k+1 


l 
list(th=k/n,va=k/n * (1-k/n)/n) 
} 
exam6.2 _2 =function( n). | 
X =matrix(Ü ,nrow=2 * n,ncol=5) 
k=0;I=0;r=0 
q=seq(1,2 *n,2) 
for(i in q) Í| 
for(j in 1:5)1 
U=runif(1) 
X[i,j] =-log(U) *j 
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X[i+1,j]=-log(1-U) * j 


} 
for(min1.(2*n))| 
if(sum(X[m,])>21.6) | 
I[m]=1;k=k+l 
lelse Im] =0 
| 
for(i in q)] 
i#(I[i] *I[i+1]==1)1 
r=r+] 
| 
l 
list(th=k/(2 *n),va=k/(2 *n) * (1-k/n)/(2 * n)+r/(2 * n°)) 
} 
运行 exam6. 2_1 (20000) 得 到 6 的 估计 为 0. 17265 , 方差 为 7. 142099e- 
06 ; 运行 exam6.2_2(10000) 得 到 9 的 估计 为 0. 17215 , 方差 为 5. 838938e—06. 
如 果 运用 正 态 随机 变量 了 ~ N(j,o") 模拟 估计 ELAY, ,Y,,,Y,)] (Ch 
是 其 坐标 的 单调 函数 ) 时 ,我 们 也 可 以 用 对 偶 变 量 法 减少 方差 . 
首先 产生 均值 为 方差 为 o? 的 正 态 随机 变量 Y, 然后 取 对 偶 变 量 2u - 
Y, 易 知 2u -了 也 具有 均值 jw MTE. 显然 它 和 了 是 负 相 关 的 . 


6.2 条 件 期 望 法 


假设 我 们 要 模拟 估计 随机 变量 X 的 期 望 9 = EX. 如 果 给 定 某 个 变量 Y 且 
其 概率 分 布 已 知 , 当 给 定 了 时 ,在 给 定 Y 时 的 条 件 分 布 可 以 确定 , 那 我 们 就 


先 从 Y 中 抽样 得 到 了,Y,，,…,Y,，, 然后 计算 出 E[X|Y = y,] WA, EA X, = 
LS ELX |Y =y] 对 8 进行 估计 .由 1.2.1 节 知 ,元 为 9 的 无 偏 估计 , 且 其 广 
Var(X,) = 一 Var(E[X | 7] ) = —Var( X) - —E[Var(X | r) ]. 


由 此 知 ,条 件 抽样 比 直 接 独立 地 抽取 个 下 对 6 的 估计 要 精确 . 称 此 条 件 抽样 
方法 为 条 件 期 望 方差 缩减 法 ( conditional expectation) ) . 
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【 例 6.3】 用 条 件 期 望 方差 缩减 法 模拟 估计 z. 在 例 3.3 中 我 们 采用 了 
在 一 个 以 原点 为 中 心 面 积 为 4 的 正方 形 内 随机 地 选择 落 在 此 区 域 中 的 半径 为 
1 的 圆 盘 内 的 点 来 估计 5. 令 VV = 2U, -1, 其 中 VU,i= 1,2 是 随机 数 , 令 


1 V? + V? 
=i Sa | 
在 例 3.3 中 知 E[I] = 二 .而 
E[I|V, =x]= P|V 2 + V,' < 1 | V, =v} 
= P| +V, < 1| V, = | 
=P|V”<1-%?] (根据 V 和 VV, 相互 独立 ) 
=P|-/1 -v < V, < /1 — = | 


-六 一 二 dx (BS V, 服从 (- 1,1) 上 的 均匀 分 布 ) 
A 2 
=V1-v. 
即 
E[I|V ] = /l1 - V, 

从 而 

Var(E[I| V,])= Var(/1 - V?) = E(1 - V°) - (E(./1 - V”) )° 

-2 -(T) =o 0498 

易 知 


Var( 1) =F! - =) = 0. 1686, 


从 而 证 明了 条 件 期 望 方差 缩减 法 使 独立 抽样 法 的 方差 减少 了 70.44% ,而 且 
还 可 看 到 对 每 次 模拟 仅仅 需要 一 个 随机 数 而 不 是 两 个 . 进一步 还 可 以 看 到 


EJ- v) = f A „dars f Vi T dr = E(VI -U ) 
其 中 UU 为 随机 数 . 因为 函数 V1 - w 显然 在 区 间 0 <u < 1 上 是 的 单调 下 降 


函数 ,所 以 可 用 对 偶 变 量 方法 对 上 述 模拟 再 作 进一步 改进 ， 
【 例 6.4】 在 保险 中 , 令 X, 表示 第 i 个 客户 的 索赔 量 , N 表示 到 某 个 特定 


N . 
时 刻 上 保险 公司 被 索赔 的 次 数 . 令 S = > X, ER + BJ Pt Ë Z: rt] J 25 EE 
赔 量 . 通常 假定 X,,i= 1,2,… 是 独立 同 分 布 的 . 如 果 在 给 定 随机 变量 4 = À 的 
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条 件 下 , N 的 条 件 分 布 是 具有 均值 的 Poisson 过 程 , 称 N 是 一 个 合成 的 Pois- 
son 随机 变量 . 如 果 4 有 概率 密度 函数 g( 和 A), 易 知 


pin =n = [7 Eaa 


A 的 分 布 函 数 就 称 为 合成 分 布 函 数 . 
为 了 保证 保险 公司 不 致 破产 ,要 对 下 面 的 破产 率 进行 估计 ; 


p= PÍ > x, > c}, 
其 中 。 > 0 为 某 个 索赔 底 限 . 粗糙 的 模拟 方法 是 
Step 1 :产生 的 值 , 记 为 W = n. 
Step 2: 产 生 X, X, ,五 的 值 , 令 


I N # Yx > c, 
0, 否则 . 
Step 3: 产 生 车 干 1 的 值 ,然后 计算 其 平均 值 即 为 p 的 估计 量 . 


SM=min|n: PX > e). 注意 到 7 = 1eN > M, Tü E[I| M = m] = 


PINZ=M|M=m| =PIN > m|, 故我 们 可 通过 条 件 期 望 法 对 上 述 估计 量 进 
行 改进 ,其 算法 为 
Step 1:75Æ X, 的 值 ,直到 产生 的 值 的 和 超过 常数 c 时 停止 . 
Step 2: 令 1 为 Step 1 中 XX 的 个 数 . 
Step 3: 用 PIN > m) 作为 此 模拟 的 p 的 估计 量 . 
【 例 6.5】 ( 例 6.4 的 应 用 ) 假 设 在 一 周 内 ,一 个 保险 公司 的 意外 保险 索 
Mita iS aaa U. 如 果 因 素 的 值 U =u, 那么 索赔 次 数 将 服从 均值 为 


的 Poisson 分 布 .假设 U 服 从 (0,1) 上 的 均匀 分 布 , 令 p 表示 在 一 周 时 








0.5 +u 于 +u 
间 内 至 少 有 20 次 索赔 的 概率 . 用 条 件 期 望 法 产生 一 个 有 效 的 模拟 估计 量 . 
令 
Š í: ， 车 N>20, 
0， 否则 . 
MEPU =al =f areal- gah aa r) ETEN Ple = 


0. 2897, 其 方差 Var(1) = p(1 - p) = 0. 20578. 
计算 9 = PIN = n] 的 程序 为 
h=0 
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for(n in 1:19)1 
g =function (x )exp( -15/(0.5+x)) * (15/ (0.5+x))"/prod(1:n) 
h[n+1 ] =integrate(g,0,1) $ value 


g0 = function ( x)exp( -15/ (0. 5+x)) 
h[ 1 ] =integrate( g0,0,1) $ value 
h[21]=1-sum(h[1:20]) 
得 到 PIN > 20} = 0. 2897083. 
条 件 期 望 法 : 先 产 生 随 机 数 U, 在 U = u 的 条 件 下 ,产生 一 个 Poisson 随机 
变量 ,对 此 进行 n 次 模拟 , 求 出 N > 20 的 频率 .其 R 程序 为 
exam6. 4 = function( n) Í 
k=0;N=0 
for(i in 1:n)| 
u=runif(1) 
N[i] =rpois(1,15/(0.5+u)) 
if(N[i]>=20)]| 
k=k+1 
| 
} 
k/n 


我 们 运行 exam6. 4 (20000 ) , 443 p 的 估计 值 为 0. 28525 ,标准 误差 为 
0. 00319. 


6.3 分 层 抽 样 法 


假设 某 随机 变量 S 依赖 于 随机 变量 XX, 以 一 定 的 概率 p;,i=1,2,…,! 取 
值 x ,x;,… xi 如 果 我 们 要 估计 随机 变量 S 的 均值 9 = ES, 直接 的 方法 是 从 5 
中 抽取 个 简单 随机 样本 S, ,S,,… Sn, 用 样本 平均 值 5 来 估计 9, 其 估计 的 


标准 误差 为 ,art 


因为 ES = P ELS|X =x ]PIX ==] = $ E[S]X = x], 我 们 可 以 从 
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k; 
S|X = x,,i =1,2,.…,1 中 抽取 样本 S; ,j = 1,2,,k, ES - T Y Si， 以 及 
i j=l 


S` = E pS: ,n= Y k, JBS 作为 6 的 估计 ,此 估计 也 是 9 的 无 偏 估 计 , 且 其 
标准 误差 








三 -一 ! p Var(S | X = x, 
Var( S“ = > Pi ar( | x) 
t=1 


k, 
比 上 述 直接 的 方法 的 要 小 . 此 方法 称 为 分 层 抽样 法 ( stratified sampling) . 
现在 的 问题 是 给 定 总 样本 数 ,每 层 抽 多 少 能 够 使 估计 的 标准 差 最 小 . 记 


Pi Var(S | X = x,) : 
o= Y> " ta(n- Zr) 
由 微 积分 知识 ,我 们 解 如 下 方程 : 
2 _ = 1, 
ak, Z i=1,.…,7, 
2300 
0A 


就 可 确定 ,i = 1,2,…, 的 值 . 

【 例 6.6】 ( 续 例 6.1) 我 们 将 抽样 区 间 [0,1] 划分 为 两 个 小 区 间 : [0， 
0.5) ,[0.5,1]. 假设 以 概率 0.5 选择 从 U(0,0.5) 中 抽取 个 独立 的 随机 变 
EU, j=1,2,…,k ,以 概率 0.5 选择 从 UV(0.5,1) 中 抽取 大 个 独立 的 随机 
变量 0, ,j= 1,2,…,k. 如 果 要 求 和 例 6.1 从 区 间 [0,1] 中 抽取 的 随机 数 的 
A+ # n 相同 ,那么 如 何 用 分 层 抽样 法 对 例 6. 1 中 的 9 进行 模拟 ? 

易 知 


0.5 
Fe = f 2e*dx = 2(Ve - 1), 
0 
1 
Ees f 2eřdx =2(e -we)， 
0.5 
0.5 
Var(Ú,,)= f 2e”*dx -4(We ~- 1)2 =e - 1 — 4(/e - 1)2 = 0.03492, 
1 
Var( U, ,)= | ,20 dx -4(e -Ve)’ = 0. 09493. 


. < 1 
Tio, = /Var(U,,) ,i=1,2, S=. 
1 


0.526 0.52; 
k O k, ` 


ki 1 k 
Xe + ps Y e M 
= 2 


j j=1 


Var( S) = 
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0. 06125 





k 
对 上 式 求 导 , 知 元 == = 0. 37753 时 , Var( S) 达到 最 小 , 且 为 一 全 全 


与 例 6. 1 的 结果 比较 得 
0.0078 _ 0.06125 _ 0.242 


n n n 

由 此 表明 对 偶 变 量 法 优 于 分 层 抽 样 法 ,分 层 抽样 法 优 于 独立 抽样 法 . 

【 例 6.7】 在 电脑 游戏 机 中 ,一 个 玩 
家 将 1 美元 揪 入 机 器 中 ,然后 机 器 随机 地 
发 给 该 玩家 5 张 牌 . 允许 玩家 将 其 中 的 几 
张 牌 与 余下 的 47 张 牌 更 换 一 次 . 玩家 获得 
的 盈利 依赖 于 其 最 后 的 牌 型 . 下面 是 一 个 
典型 的 一 利 表 . 

表 中 不 同 牌 型 互 不 相 容 . 

考虑 某 种 策略 ,例如 ,如 果 最 初 的 牌 是 
“ 顺 子 "或 更 好 的 牌 就 不 再 换 牌 ,如 果 低 于 
此 牌 型 ,通常 保留 手中 的 对 子 或 三 条 . 在 此 
策略 下 , 令 世 表示 玩家 在 某 一 手中 的 盘 
利 , 且 假设 我 们 对 估计 9 = E| X] 感 兴趣 . 
让 我 们 以 最 初 发 给 玩家 的 牌 型 为 条 件 开始 f 
估计 ,而 不 是 直接 用 作为 一 个 估计 量 . 令 R 代表 “ 同 花 大 硕 ”,S 代表 “ 同 花 
顺 ”, 4 RR WR”, A RR RA” fush 表示 “ 同 花 ”,staight 表示 “ 顺 ”, 3 
代表 “三 条 ” , 2 代表 “两 对 ”, 1 代表 “J 以 上 的 一 对 ”, 0 代表 “一 小 对 ”,“ oth- 
er” 表示“ 其 他 ”的 牌 . 我们 有 
E[X] = E[X | RIPIR} + E[X | S]P{S} + E[X|4]P{4} + ELX | ful]P{full} 

+ E[X|flush]Plflush} + E[ X | straight] 尸 | straight| + E[X|3]P{3} 
+ E[X |2]Pį{2} + E[X|1]PIl} + E[X|O]PIO} + ELX | other]P{ other}. 


再 令 C = (- T RIE 


P| R} =4C =1.539 x 10%, 
PiS} =4.9.C=1.3851 x 10%, 
P{4} = 13 - 48 - C = 2. 40096 x 10“, 





3\ /2 

P| full} = 13- 12( ) | ) C = 1.440576 x 102, 
4 \4 

13 _, 

P| fush} =4(| :) - 10) C = 1.965402 x 10, 
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Plstraight} = 10(4° - 4)C = 3.924647 x 10, 
12 
P{3} = 13( Jec = 2. 1128451 x 102, 
2 
13 4 j4 
P12]| =| ) 4 ) ) C = 4. 7539016 x 10”, 
2 2} \2 


4 /12 
P{1] = 4 )Í )#c =o. 130021239, 
2 八 3 


P0} = o(*) (3) 4° C = 0. 292547788, 
2/ \3 
Plother = 1 - P{R} - PIS} ~- Pifull} - P| flush} - Plstraight] — 
y Pli = 0. 5010527. 
因此 得 出 
E[X] = 0.0512903 + 六 E[ X | i] P1;] + E[ X | other] + 0. 5010527. 
注意 到 2 张 新 牌 来 自 余 下 的 47 张 牌 ,这 47 张 牌 包含 了 与 手中 的 3 张 相同 的 
有 牌 中 的 一 张 ,两 类 牌 型 中 的 3 张 以 及 其 他 的 10 种 牌 型 中 的 4 张 ,那么 
E[X|3] 能 够 通过 分 析 得 到 . 令 FERR- FE, RNE 
PIF=4| 发 3 张 牌 } = -全 -= 0. 042553191, 


2 


.PIF=full| 发 3 张 牌 | =2 3 + 10 -6 -0.061054579， 


47 
(2) 
PlP=3| 发 3 张 牌 | =1 - 0. 061054579 - 0. 042553191 = 0. 89639223. 
因此 ， 
E[X|3]= 25(0.042553191) + 8(0.061054579) + 3(0. 89639223) 
= 4. 241443097. 
类 似 地 ,我 们 可 以 分 析 得 到 E[X| 门 ,i = 0,1,2( 推 导 留 做 练习 ). 
在 进行 模拟 时 ,我 们 将 产生 一 手 牌 . 如 果 包 含 至 少 一 对 或 者 更 好 的 牌 , 则 
应 放弃 ,模拟 过 程 重新 开始 . 当 我 们 得 到 一 手 牌 不 包含 一 对 或 者 更 好 的 牌 , 我 
们 应 当 采 取 任 何 策略 去 放弃 和 接受 新 牌 , 若 X, ZÉ JE, F 9 0) 2 3), WJ X, 是 
E[X | other] 的 估计 量 , 且 依赖 于 这 次 模拟 的 9 = E[ X] 的 估计 是 


0=0. 0512903 + 0. 02112845 (4.241443097) + 0. 047539016E[ X |2] + 
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0. 130021239E[X|1] + 0. 292547788E[ X | 0] + 0. 5010527X,. 
估计 量 的 方差 为 
Var( 0) = (0. 5010527)2Var( X,). 

注 :(1) 我 们 曾经 假定 采取 的 策略 无 论 是 否 有 对 子 总 是 坚持 不 换 牌 . 然 
而 ,对 于 熏 利 来 说 这 不 是 一 个 最 优 的 策略 . 例如 ,如 果 一 个 人 所 发 的 牌 为 2， 
10 ,J,Q,K, 都 是 黑 桃 , 较 好 的 就 是 放弃 2 再 抽取 另外 一 张 牌 ,而 不 再 坚持 同色 
(为 什么 ). 如 果 发 的 牌 是 10 ,J,Q,K ,都 是 黑 桃 ,另外 一 张 是 红心 10 ,更 好 的 策 
略 是 扔 掉 红 心 10 ,再 抽 一 张 牌 比 保持 一 对 10 的 策略 要 好 . 

(2) 我 们 通过 拆散 “other” 类 型 的 牌 ,“other” 类 型 的 牌 包含 了 同色 的 4 张 
牌 ,以 及 不 是 这 种 类 型 的 牌 来 进一步 利用 分 层 抽样 法 . 没有 对 子 但 是 有 4 张 同 
色 的 牌 的 一 手 牌 的 概率 是 能 够 通过 分 析 计 算得 到 的 ,然后 利用 模拟 来 估计 在 
这 两 种 “other” 情 形 下 怪 利 的 条 件 期 望 . 


6.4 重要 抽样 法 


令 王 = ( ,X,,… X.) 表示 具有 联合 密度 函数 (或 联合 概率 函数 ) f(x) = 

xx xz) 的 随机 向 量 , 又 假设 我 们 对 估计 
0 = E[h(X)] = [ez)dz 

感 兴趣 ,上 式 是 一 个 对 所 有 的 PAR n EROR X 是 离散 的 ,那么 积分 
就 意味 着 n ERKAM). 

如 果 模 拟 具 有 密度 函数 为 f(x) 的 随机 向 量 是 困难 的 ,或 者 h( 圣 ) 的 方差 
很 大 ,那么 就 不 能 直接 用 产生 n 组 随机 向 量 X, 来 估计 0. 对 此 问题 ,我 们 将 用 
下 面 的 方法 解决 . 

如 果 g(x) 是 另 一 个 概率 密度 , 且 当 g(z)=0 时 ,和 =0, 那 么 能 够 表达 8 
为 


_ [ h(x)f(x) -g [h(x)f(x) 
o= | my el) de = E [A , (6.4.1) 


AHE, 指 “0 关于 联合 密度 g(x) 求 期 望 . 
由 方程 (6.4.1) 知 ,通过 连续 地 产生 具有 密度 函数 g(x) 的 随机 向 量 X 的 


"组 值 ， 然 后 用 了 = 二 于 一 作为 人 计量 来 估计 0. 如 果 密度 函数 


g(x) 能 够 被 选择 使 得 随机 变量 s 有 一 个 小 的 方差 ,那么 此 方法 称 为 
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重要 抽样 法 ( importance sampling) , 它 能 够 产生 出 9 的 一 个 有 效 估计 . 
现在 问题 是 如 何 选择 g(x) 使 得 重要 抽样 法 的 方差 最 小 . 考虑 

1 h(X,)/( X,) 2 

EERO] -人 


Var(b) = 一 (X) 


从 理论 上 看 , 若 几 X) >0 取 g(X) OOO gj Var(6) =0. 因为 9 是 未 知 


的 ,这 个 结果 是 无 用 的 . 但 它 也 给 我 们 一 个 启示 ,应 该 选取 与 f( X) 形状 接近 
的 g(X) 可 以 减 小 方差 . 这 就 是 重要 抽样 法 的 基本 思想 . 


& M(t) = 已 [ex] = IROLE DEERAS KER AS. 我 们 称 密度 函 
# G) = S 为 了 的 址 密度 函数 

设 随机 变量 X 的 分 布 函数 为 F(x) , 随机 变量 了 的 分 布 函数 为 CO), 若 
对 任意 的 实数 z, 有 Fla) < C(x), 则 称 随机 变量 随机 的 不 小 于 Y, 记 为 
X > Y. 易 知 , 当 t > 0 时 ,具有 密度 函数 /的 随机 变量 比 具有 密度 f 的 随机 变 
量 大 ,而 当 + < 0 时 , 则 相反 . 

例如 , 服从 标准 正 态 分 布 N(0,1), 可 以 得 到 其 考 密 度 Sa) = 


遍 " 令 了 的 密度 函数 为 上 (7y) , 我 们 容易 验证 , 当 : > 0 时 ,对 任意 的 实 
T 


数 x, 有 1-F(x)=| ”一 

x 2 

从 此 例 也 可 看 出 , E 36 264836 F , ARE /, 和 /具有 相同 的 表达 形式 . 所 以 我 
们 根据 矩 母 函数 构造 g(%). 

一 般 来 说 ,对 于 一 个 小 概率 事件 ,在 计算 机 上 是 很 难 直 接 模拟 的 ,我 们 用 


重要 抽样 法 先 模 拟 一 个 较 大 概率 的 事件 ,再 转化 为 所 要 模拟 的 小 概率 事件 . 
【 例 6.8】 假设 X,i = 1,2,…,20, 相互 独立 ,其 概率 函数 为 p(x) = 


P'(1-p) ,其 中 x=0 或 1,p=0.4. 今 8= X> X- 试 估计 9=P1S > 16]. 


- (02 
l —%24⁄=1- G(z), BI X < Y. 








- 2 a 
ež de< f 
x 


令 
1 , 若 $ > 16, 
0 ,否则 ， 


以 及 P(z) 的 起 密度 函数 为 p(x) = 1, M| 0 = E,US z 16]] = 


HS > 16] =f 


0. 4*0. 61 


E, [rs > 16] FOD 


| - 我 们 得 到 9 的 重要 抽样 估计 量 为 
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20 

和 X. 

9=1{S > 16}1] KX) js > 16}e (0.6 + 0.4e')20. 450. 62 
i=l i 


a 16 
B Ô < e™(0.6 + 0.4e')20. (2) A h(t) =e™"(0.6 + 0.4e')”. 34 


t > 0 时 ,我 们 得 到 使 hO) 取 最 小 值 的 上 = log 6. 则 9 的 重要 抽样 估计 量 为 


¿=s > 161( 二 32 (6.4.2) 
= 6 `. . a 
易 知 

a 13 16220 81 

< (二 3” = 二 = 0.001236. 

6 (本 2" 


因为 6 很 小 ,直接 由 二 项 分 布 B(20,0.4) 很 难产 生 事件 [S > 16}, 所 以 我 们 
注意 到 砖 密度 
0. 4e" 0.4 - 6° 0.4 - 6° 


Se) ro dor -0.6+04.6 3 ° 


而 上 .(1)=0.8 且 8(20,0.8) 的 均值 为 16 ,由 此 知 从 这 个 二 项 分 布 中 很 容易 
产生 事件 |S > 161, 然后 将 这 里 的 S 代入 (6.4.2) 中 就 达到 了 目的 . 
其 R 程序 为 
exam6.7 = function(n ) | 
th0 = function($) | 32/6°] 
th=0 
for(i in 1:n)| 
RB =rbinom(1 ,20,0.8) 
if(RB>=16) th[i] =th0( RB) else th[i]=0 
l 
list(mean=mean( th) ,var=var( th) ) 
| 
运行 exam6.7(10000) 得 到 9 = 0. 0003229011, 其 方差 为 2.455389e-07. 
【 例 6.9】 < X = (Xi,X，…,Xiw) 是 (1,2,…,100) 的 一 个 随机 置换 





100 


(排列 ). 记 8 = P| >x, > 290000 }. 试 估 计 0. 
首先 来 判断 9 是 否 很 小 . 如 果 不 太 小 ,我 们 可 以 直接 模拟 出 n 次 排列 ,将 
满足 条 件 > X, > 290 的 排列 的 个 数 m BR n 就 得 到 8 的 估计 , 如 果 0 是 很 小 ， 


100 


这 样 进行 的 模拟 不 太 稳定 ,估计 的 效果 不 好 . 因此 ,我们 首先 计算 > X, 的 均 
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值 和 标准 差 . 事实 上 ,容易 看 到 


1 101 
EX, = 1 x * + 100 x x 100 = > 


EX? = 12 x+…+l00x-L = 101x67 


i 100 100 ” 2 
Var[X,] = EX}? - (EX,)’ s2, 

1 101 x 151 

EXX, ] =— = 101 x 151 

[XX] 100 x 99 27 6 
， 101 
Cov(X,,X,) = E[X x,] - (gx): =- 191 

则 


100 


S. 101 
e| $x] = J Ex, - 151 $ j = 255025, 
= i 





100 100 100 
va | Xx) =$ P Var[X,] +2 Ý, Cov(jX,,kX,) 
j=1 j=1 1sjs Ks100 
=25 x 67 x 101 x 3333 3233 -25 x 1012 x 1661 
=70131875 


SD | Xx) = /70131875 = 8374. 478. 
从 而 ,如 果 假设 XX, 近似 地 服从 正 态 分 布 ,用 Z 表示 标准 的 正 态 随机 变量 ， 
那么 我 们 有 


290000 - 255025 
= P 一 一 一 一 一 一 -一 一 一 
ý {z 8374. 478 


显然 0 是 一 个 小 概率 ,因此 我 们 用 重要 抽样 法 模拟 估计 0. 


} = P|Z > 4.1764} = 0. 00001481. 


100 


为 了 利用 重要 抽样 法 RIRE k — E X tE18 2 JX, > 290000 有 


一 个 较 大 的 概率 出 现 .事实 上 , 当 j 大 、X, 也 较 大 时 ， >x, 就 大 ;反之 ， >x, 
就 较 小 .产生 上 述 符合 事实 的 互 的 一 个 方法 是 

Step1 :首先 产生 独立 的 具有 均值 À; 的 指数 随机 变量 Y,, J = 1,2, ,100 
其 中 心 > 0,j = 1,2,…,100 为 单调 上 升序 列 . 

Step2 :对 于 j= 1.2,…,100, 令 厂 是 第 /个 最 大 值 的 指标 . 即 , Y, > Yy, > … > 
Yx: 
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因为 对 于 大 的 j, Y 将 趋 于 Y 中 一 个 较 小 的 值 ,从 而 得 到 当 j 大 时 ,X, 趋 于 
取 大 的 值 ,因此 > x, 比 当 天 为 均匀 分 布置 换 时 趋 于 更 大 . 


现在 ,我 们 来 计算 z| $x]. SRG) 表示 7,j = 1,2,… ,100, 的 秩 , 这 


ER 1 表示 最 大 的 , 秩 2 表示 第 2 大 的 ,等 等 , 秩 100 表示 最 小 的 .注意 到 因为 
X, Æ 中 的 第 /个 最 大 的 ， WA R(X,) = 从 而 


Xx, = 2 RO, )X; = YQ, 
其 中 最 后 一 个 等 式 成 立 是 因为 x, .X,, X, 是 1 ,2,… ,100 的 一 个 置换 . A 
此 ,我们 看 到 


z| zx | = Ş ELRO) 1. 
为 了 计算 ELRG)], $ 
up. <" 


0 ,和 否则， 
并 注意 到 


RG)=1 + $ 1G). 
上 述 方程 表明 Y, 的 秩 是 1 加 上 使 Y > Y, i Y, AA. 因此 ,对 之 取 期 望 并 用 
到 下 述 事 实 : 


P|Y, < Y.] = À; 
; < i A. +A; 


了 





我 们 得 到 
E[R ] =1 + > 





À; +A,’ 
由 此 有 





100 . _ 100 . À; 
E| Xx] = Bil t> x >: 
如 果 令 =j*" j=1,2,…,100, 那么 由 计算 得 到 | Xx, | = 290293. 6. 所 
以 当下 是 由 这 些 参数 生成 时 ,将 有 
100 


?| Y X, > 290,000 | = 0.5. 
j=l 


这 是 一 个 较 大 的 概率 . 从 而 ,我 们 假设 模拟 估计 量 首先 通过 产生 独立 的 速率 分 
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别 为 产 " 的 指数 随机 变量 Y, 然后 令 总 为 第 j 大 的 指标 ,j = 1,2,…,100, 而 得 
到 . 令 


100 
人 > 290000, 
了 = j=l 


0 ,否则 . 
那么 结果 是 站 为 Fr 是 最 小 的 了 , Yy, 是 第 2 小 的 …… 一 个 排列 . 当 无 等 可 能 


地 为 排列 中 的 一 个 时 ,那么 此 结果 的 概率 为 o! ， 当 模拟 按 这 样 进行 时 ,其 概 


率 为 

(X) (X) D Xi)" 
100 99 2 X 0.7" 
> (X)? > (X)°” > (X) ( 1) 


jzi 


因此 ,由 1 次 模拟 得 到 的 重要 抽样 估计 量 为 


100 


， Ñ (še) Ü (oo) 








ĝ = n=1 \ j=1 n= j=1 
一 (100) ! 100 0.7 一 100 1.7 
(1) [H] 
n=1 n=1 


模拟 算法 为 
Step 1: 计 算 C = 1.7 Y log(n) Mal) =-j "j =1,2,…,100, 的 值 . 
Step 2: 分 别 对 j= 1,2,…,100, 产生 随机 数 0,, 令 Y, = a(j)log( U). 


Step 3: 产 生 X,,j = 1 ,2，…，,100， 其 中 X, 是 使 得 Yy 为 Y, j= 1 ,2,.… ,100, 
中 的 第 /7 大 的 数 . 
100 
Step 4: 如 果 X jX, < 290000, MJS ô = 0 并 停止 . 
7=1 
Step 5: F0), E S= P =0, J n JA 1 J 100, S =S + (X.)°” 7, P = P + 
log( S) ; 令 9 = e", 
重复 运行 Step 2 至 Step 5r 次 ,计算 0 的 平均 值 。 
其 R 程序 为 
C=1.7 * sum(log(1:100)) ;theta=0 
for(r in 1:50000) | 
Y=0;U=0 
for(j in 1:100) | 
U[j] =runif(1) 
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Y[j]=-j^(-0.7) *log(U[j]) 
l 
X=0 
for(i in 1:100) | 
X[i]=order( Y)[100-i+1] 
| 
m=1:100 
if( sum( m * X) <=290000) theta[ r] = 0 
else| ` 
S=0;P=0 
for(n in 1:100) | 
S=S+X[n]“(0.7) 
P=P+log( S) 
l 
theta[ r] =exp(P-C) 
| 
l 


50000 次 模拟 的 样本 产生 的 估计 量 0 = 4.580375 x 10, 其 样本 方差 为 
2.956643 x 10%. 因为 对 粗略 模拟 估计 量 1 的 方差 为 Var( = 9(1 - 0) = 
3.77 x 10 ,我们 看 到 
Var( I) 
Var( 0) 


== 127. 5. 


练 习 6 


1. 试 利用 对 偶 变量 法 对 6 = | "e dx 进行 估计 ,并 与 独立 抽样 方法 得 到 的 
方差 进行 比较 。 
2. 如 何 通过 对 偶 变量 法 得 到 9 = | | e dady 的 一 个 模拟 估计 量 ? 利 


用 对 偶 变量 法 是 否 比 独立 地 产生 随机 数 更 有 效 ? 并 给 出 其 估计 . 
3.(1) 车 Z 是 一 个 标准 正 态 随机 变量 ,利用 对 偶 变量 法 设计 一 个 算法 估 
ito = 有 [Ze ], 并 编写 程序 . 
(2) 利 用 上 述 方法 做 模拟 得 到 区 间 长 度 不 会 超过 0. 1 的 置信 区 间 ,你 能 
163 


统计 模拟 及 其 RR 实现 % 





确信 此 区 间 以 95% 的 置信 度 包含 9 的 值 吗 ? 


4. 设 XX 是 一 个 具有 均值 1 的 指数 随机 变量 . 

(1) 给 出 一 个 与 X 负 相关 且 也 是 均值 为 1 的 指数 随机 变量 ; 

(2) 用 对 偶 变量 法 估计 9 = | "edx ; 

(3) 用 重要 抽样 法 估计 (2) 中 的 积分 ; 

(4) 比较 上 述 (2) ,(3 ) 的 效率 . 

5. 令 开 和 了 是 相互 独立 的 其 分 布 函数 分 别 为 严 和 G, 其 均值 分 别 为 和 


Ar 的 随机 变量 . 对 一 给 定 的 值 ;, 我 们 感 兴趣 的 是 估计 6 = PIX + Y < ih. 


《1) 给 出 一 个 粗糙 模拟 方法 估计 0 ; 
(2) 用 条 件 期 望 法 获得 一 个 改进 的 估计 量 . 
6. 假设 Y 是 一 个 均值 为 1、 方 差 为 1 的 正 态 随机 变量 ,又 假设 在 了 =y 的 条 


件 下 ,XX 是 一 个 均值 为 y 方差 为 4 的 正 态 随机 变量 . 我们 用 模拟 来 有 效 地 估 


计 6 


用 条 


1,2, 
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= PIX > 1|. 

(1) 解 释 此 粗糙 的 模拟 估计 量 ; 

(2) 说 明 这 个 条 件 期 望 如 何 被 用 来 获得 一 个 改进 的 估计 量 ，; 
(3) 说 明 (2) 中 的 估计 量 如何 通 过 利用 对 偶 变量 法 进一步 地 改进 
写 一 个 模拟 程序 并 用 它 来 找 出 估计 量 的 方差 : 

〈4) 粗糙 模拟 估计 量 ; 

(5) 条 件 期 望 佑 计量; 

《6) 用 条 件 期 望 和 对 偶 变量 法 的 复合 估计 量 ; 

(7) 0 的 精确 值 是 多 少 ? 

7. 令 王 和 了 是 相互 独立 的 指数 随机 变量 , 瑟 具 有 均值 1, 了 具有 均值 2. 试 
件 期 望 法 模拟 估计 PIX + Y > 4|. 

8. 令 下 和 了 是 独 立 的 5(n,P) 随机 变量 , 令 8 = E[e”’]. 

(1) 给 出 模拟 9 的 粗糙 估计 量 ; 

(2) 用 对 偶 变 量 法 进行 改进 ; 

(3) 用 条 件 期 望 法 改进 粗糙 估计 量 . 


9. 考 虑 一 个 有 20 个 独立 部 件 的 系统 ,其 中 部 件 i 是 以 概率 0.5 + L ¿= 


50° 
… ,20 ,失效 . S X RRRA RFR. 
(1) 用 模拟 来 有 效 估计 PIX s5}; 
(2481 PIX = 5]X s5}. 


10. 试 利用 分 层 抽样 法 估计 9 = E(W, + W,)* , 其 中 W, , W, 是 独立 同 分 布 
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的 Weibull( 威 布尔 ) 分 布 ,其 密度 函数 为 
f(x) = — < exp( 一 x7) , x > 0. 

11. 假设 随机 变量 并 ~ W(2,4) , 给 出 估计 EX 的 方法 并 用 对 偶 变 量 法 进 
行 改进 ,编写 程序 进行 计算 并 与 其 精确 值 进行 比较 . 

12. 考虑 积分 

0 = f x e t dx 

(1) 给 出 估计 8 的 几 种 有 效 方法 . 

(2) 编写 相关 的 程序 估计 0, 比较 这 几 种 方法 的 效率 . 

13. 在 例 6. 6 中 ,推导 并 计算 E[x |i] ,i =0,1,2. 

14. 假设 随机 变量 ,i = 1,2,…,n 服从 正 态 分 布 N(u,o°). 

(1) 证 :其 想 密 度 也 是 正 态 分 布 N(u + t,o). 


(2) 利用 重要 抽样 法 给 出 9 = pf > e“ > a] 的 估计 量 . 
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~ PIA 
统计 模型 识别 方法 


在 本 章 中 我 们 考虑 一 些 用 于 统计 模型 识别 中 的 模拟 程序 ,分 别 考虑 单 样 
本 、 两 样本 的 检验 及 非 齐 次 Poisson 过 程 假设 模型 的 模拟 验证 。 


7.1 单 样本 的 拟 合 优 度 检 验 


人 们 对 所 遇见 的 现象 进行 分 析 时 经 常会 提出 一 些 假设 ,这 个 假设 就 是 某 
个 特定 的 概率 分 布 . 然后 根据 观测 数据 对 这 个 假设 作 统 计 上 的 检验 ,也 就 是 判 
断 这 个 特定 的 概率 分 布 假设 与 观测 数据 是 否 一 致 . 这 种 检验 称 为 拟 合 优 度 检 
验 . 

进行 拟 合 优 度 检 验 的 一 种 方法 是 , 先 划 分 随机 量 的 可 能 值 为 有 限 个 数 的 
区 域 . 对 指定 的 概率 分 布 , 当 所 假定 的 分 布 所 有 的 参数 被 指定 时 ,可 以 计算 出 
随机 量 在 这 些 区 域 上 取 值 的 概率 . (我 们 将 观测 到 的 样本 数 n 按 每 个 区 域 上 的 
概率 进行 分 配 , 称 为 理论 上 的 个 数 ). 然后 将 之 与 样本 值 落 在 每 个 区 域 的 个 数 
进行 比较 . 

在 下 一 节 中 , 当 某 一 个 参数 没有 被 指定 时 ,我们 也 考虑 这 样 的 检验 . 首先 
考虑 一 个 离散 的 假设 分 布 情形 ,其 次 考虑 连续 的 假设 分 布 情形 . 

1. 离散 数据 的 拟 合 优 度 的 x? 检验 

假设 随机 变量 了 以 概率 |p, i = 1,2,…,k| 取 值 1,2,…,k, 1 p, 未 知 .从 
Y 中 得 到 个 独立 的 观测 值 7 ,Y,，… Y. 我 们 要 对 假设 : [pi = 1,2,… ,有 
进行 检验 . 将 被 检验 的 假设 记 为 H, 称 为 零 假设 , 即 

Hu:PlY=i} = 了， i=1,2,.…,k. 
要 检验 上 述 假设 , 令 Ni,,i=1,2,…,k, 表示 这 些 7 等 于 i 的 个 数 . 如 果 H, 为 真 
时 , 则 N. 服从 参数 n 和 ;的 二 项 分 布 , 且 有 E[N,] =np,. 而 (NV, - np) 表明 
p, 与 PIY =i) 接近 的 程度 . 34 (N, - np.) ° 相对 于 np, 来 说 大 时 ,表明 H, KE 
确 . 从 而 ,考虑 统计 量 
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Q = y w apo (N, D, 
当 Q 的 值 小 时 ,表明 H, ERR, 2 H, TA 根据 实际 数据 计算 出 检验 统计 
E Q 的 值 为 上 34 H, 为 真 时 ,其 p 值 为 
P È = P, 1Q > t]. 
E p 值 小 于 某 个 给 定 的 检验 水 平 a (通常 为 0.05 或 者 是 更 保守 的 取 0.01) H 
现时 ,表明 Q 超出 了 我 们 能 够 容忍 出 现 误差 的 程度 ,所 以 有 理由 拒绝 零 假设 ， 
因此 说 明 数 据 和 模型 不 一 致 ;否则 ,就 接受 零 假设 ,说 明 数 据 和 模型 是 一 致 的 . 
在 观测 到 检验 统计 量 Q 的 值 上 后 , 剩 下 来 就 是 确定 概率 P 值 = P, 1Q > 
t). 当 H, 为 真 时 ,对 充分 大 的 n, Q 近似 服从 自由 度 为 £ - 1 J y 分 布 .从 而 
p = PiX? zt, (7.1.1) 
其 中 X; 是 一 个 具有 自由 度 k - 1 的 好 随机 变量 . 称 此 检验 法 为 Pearson 1 
优 度 * 检验 法 ,或 简称 为 拟 合 优 度 刀 检验 法 . 若 利用 Pearson WARE y 检验 
法 得 到 的 p 值 接近 于 检验 水 平 a, 这 样 就 很 难 判 断 是 接受 还 是 拒绝 原 假 设 , 因 
为 这 时 的 p 值 是 用 xX? 分布 近似 的 ,这 时 有 必要 对 p 值 做 进一步 的 验证 ， 即 求 出 
它 的 精确 p 值 ,这 就 要 借助 于 模拟 计算 . 
【 例 7.1】 为 确定 某 一 山 子 是 否 均 匀 , 将 其 抛 据 100 次 ,出 现 各 点 的 次 数 
如 表 7-1 所 示 . 











表 7-1 
点 1 2 3 4 5 6 
次 数 20 7 23 17 12 21 


Jj X KOR 1988 -f Hi BU h) sa 3k. 设 H, BTE, BB PIX =i) = 


i=1,2,…,6. 在 如 下 ,出 现 个 点 的 理论 次 数 为 : nP|X = il = 16.667. H 
(20 - 16. 667) E - 16. 667)? n (23 - 16. 667) 


1 
6 3 





Q = 116667 16. 667 16. 667 
(17 - 16.667)? <12 - 16.667)? (21 - 16. 667)° 
16. 667 16. 667 16. 667 
=11. 12 


£ p A 0. 049056 , 与 0. 05 很 接近 ,难以 判断 是 否 接受 H,, 需要 进一步 抽样 
验证 . 下 面 用 计算 机 模拟 验证 : 
Step 1: 在 H, 下 ,产生 n 个 相互 独立 的 随机 变量 YO Y ,… ,了 ”好 
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P| y" = i} =pi,i = 1,2,.…,k,j = 1,2,.…,n. 
S (Ni? - np,)° 
Step 2: 记 N” =#Jj:Y0 =i}, $= y (N, np) 
i=1 np; 
其 中 # 表 示 计 数 . 
Step 3: 重 复 Step 1 和 Step 2, 得 到 m 组 相互 独立 的 数据 集 YO yt ，…， 
yt 和 g'5. 


Step 4; L 的 个 数 : 


其 中 # 表 示 计 数 . 
从 而 ,由 大 数 定律 , 0; > :的 比率 是 非常 接近 于 当 H, 为 真 时 Q > : 的 概 
Z, 
其 R 程序 为 
exam7. 1. 1 =function( m) Í 
Q=0;N=rep(0,6) 
for(i in 1:m) l 
Y =sample( 1 :6 ,100 , replace =TRUE) 
N=c(length( Y[Y==1 ]) ,length( Y[ Y= =2]) ,length ( Y 
[Y==3]), 
length( Y[ Y = =4]) ,length(Y[Y==5]),length(Y[Y= = 
6])) 
Q[i] =sum( (N-100/6)’ * 6/100) 


#11:0" 之 t} 
~an . 


l 
length( Q[ Q>=11.11978])/m 
| 
运行 exam7.1.1(200000) 得 到 p 值 为 0.049005, 据 此 不 接受 H. 
2. 对 连续 数据 的 Kolmogrov-Smirnov 检验 
假设 连续 型 随机 变量 了 具有 分 布 函数 F, 从 中 得 到 相互 独立 的 观测 值 
了 ,了 ,… ,Y,. 我 们 要 对 了 是否 具有 分 布 函 数 屎 进行 检验 , 设 零 假 设 
H: Y 具 有 分 布 函 数 F， 
其 中 下 是 一 个 给 定 的 连续 分 布 函数 . 
由 离散 情形 的 检验 方法 可 提出 如 下 的 检验 H, 的 方法 : 
Step 1: 将 了 的 可 能 取 值 集合 划分 为 左 个 不 相交 的 区 间 , 记 为 
(YoY) (y) 7 (ya), 其 中 yo=-o,7 =+ e, 
Step 2: 将 观测 值 Y, 离散 化 为 7“,j = 1,2,…,n, 即 
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Y“ =i, BY, 位 于 区 间 (y,.,,y;). 
零 假 设 蕴 涵 着 
PY =i} =F(y,) - F(y), i=1,2,.,k. 

Step 3: 运 用 x 检验 对 之 进行 拟 合 优 度 检 验 . 

然而 ,有 另外 一 种 检验 Y 是 否 服 从 连续 分 布 沙 数 下 的 检验 方法 ,这 个 方法 
比 离散 方法 更 有 效 . 其 方法 为 :根据 观测 值 Y, Yie, Y. , 得 到 经 验 分 布 函数 
F: 

F(x) = tliy s x] 
其 中 # 表 示 计 数 . 即 , Fa) 是 观测 值 不 大 于 x 的 了 个 数 所 占 的 比例 . 因为 
F (x) 是 观测 值 不 大 于 zx 的 概率 的 自然 佑 计量, 所 以 ,如 果 零 假设 下 为 真 , 那 
Z Fx) 应 该 接近 F(x). 由 此 ,对 于 任意 的 x, 检验 H, 的 统计 量 很 自然 地 为 
D = max | F(x) - F(x)|, 
其 中 最 大 值 是 对 整个 x e (- wm ,wm) mE. 统计 量 D 称 为 Kolmogrov- 
Smirnov 检验 统计 量 . 

对 于 给 定 的 数据 集 Y =y, ,j= 1,2,…,n, 将 之 从 小 到 大 排序 并 记 为 
yo yo) yay. 例如 , 若 m=3,7 = 1,y, =3,y3=0, 那么 y0)= 0,y0)=1， 
yo = 3. 因此 F(x) 又 可 以 写 为 

0,# x < yu; 


1 汪 
nf Yo =< x < Yas 


F.(x) = 


J 
£ ya €x < Ygs 


1, 若 x Z Ya 
我 们 看 到 F (x) 在 区 间 (yun Yo) 是 常数 ,而 在 点 Yo) Xe) 7 Yia) 上 


有 二 BEER. 因为 F(x) 是 x 的 单调 增 函数 , 且 以 1 为 其 界 ,从 而 FC) - 
F(x) 的 最 大 值 是 非 负 的 而 且 在 点 yay ,yt 7a 中 的 某 一 个 达到 . 也 就 是 ， 

max | F(x) — F(x) | = max [J - Fg) }- (7.1.2) 
类 似 地 , F(x) - F,(x) 的 最 大 值 也 是 非 负 的 ,在 某 个 跳跃 点 y, 之 前 立刻 发 


生 , 所 以 . 
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max|F(z) - F.(z)] = max {Fly0) -00.1.3) 
x j = 1 n 


那么 由 (7.1.2) 和 (7.1.3) 看 到 ， 
D= max | F(x) - F(x) | 


= max|max| F.(z) - F(x) | ,max| F(x) ~ F,(z)] | 


= max 位 - Fiya) Fg) -一 (7.1.4) 


(7.1.4) 可 以 被 用 来 计算 D 的 值 . 

如 果 将 观测 值 y ARA (7.1.4) PAD =d. 车 d 的 值 大 , 则 表明 下 与 数 
据 是 不 一 致 的 ;车 d 的 值 小 , 则 表明 与 数据 是 一 致 的 ;对 于 此 数据 集 , p 值 为 

P 值 = Pi1D >d}, 

这 里 我 们 记 P 表示 在 假设 H, 正确 时 计算 得 到 的 概率 值 . 

ER p 值 能 够 通过 一 个 模拟 近似 得 到 ,这 个 模拟 按 下 述 命 题 更 容易 进行 ， 
此 命题 表明 P. |D > dj 不 依赖 于 分 布 .此 结果 使 我 们 能 够 通过 做 一 个 具有 
任意 选择 的 连续 分 布 玉 的 模拟 来 估计 p 值 [ 因 此 允许 我 们 用 均匀 分 布 
U(0,1)]. 

命题 ”对 任何 连续 的 分 布 R, P. |D > dj 都 是 相同 的 . 

证 ”因为 下 是 增 函 数 ,所 以 了 < x 等 价 于 FR(Y) < F(x). 若 了 有 连续 分 布 
,那么 随机 变量 F(Y) 服从 (0,1) 上 的 均匀 分 布 .从 而 有 


n 


P. |D > d} =P, [max 








- F(x) 


#ļi:F(Y,) < F(x)| 





=P, [max 





- FG) |> a} 


=Pf max 





- FG) |> a}, 


其 中 U, ,0,,…,U, 是 独立 的 (0,1) 上 的 均匀 随机 变量 . 令 y = F(x) , 并 注意 到 
* 在 从 -œo 到 +am 取 值 时 , F(x) 的 取 值 为 0 到 1, 我 们 有 


#{i:U, < y| -y| a}, 
n 


P, |D > d} = PÍ max 


0&ys1 





上 述 表明 当 H, 为 真 时 , D 的 分 布 不 依赖 于 分 布 F. 

由 上 述 命题 知 ,在 刀 的 值 由 数据 确定 之 后 , 即 刀 =d, 则 p 值 能 够 通过 均匀 
分 布 0(0,1) 模拟 得 到 .具体 来 说 , 先 产 生 个 随机 数 U, U, U, 然后 验 
证 下 述 不 等 式 是 否 有 效 : 


max 
O=y=1 


n 





y|> d. (7.1.5) 
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这 样 重复 许多 次 ,此 不 等 式 有 效 次 数 的 比例 是 p 值 的 估计 量 . 注意 到 不 等 式 
(7.1.5) 的 左边 可 通过 对 随机 数 排序 ,然后 用 等 式 


#{i:U, < y| ; j- 1 
Hin |- max 他- F(yo),F(yo) -1 


n 了 = 1 ,2，…,nm 

而 计算 得 到 , 式 中 Up 是 0,,0,,…,U, 中 的 第 j 个 最 小 的 值 . 例如 ,如 果 n=3， 
U, =0.6,U, =0.5,U, =0.4, 则 U6)=0.4,06)=0.5,V6)=0.6, 且 对 此 数据 
Æ, D 的 值 为 


D = max - 0.4, 子 -0.5,1 -0.6,0.4,0.5 -了 ,0.6 - l =0.4. 


【 例 7.2】 假定 我 们 要 检验 假设 :给 定 的 总 体 分 布 为 均值 为 100 的 指数 
分 布 ,也 就 是 F(x) = 1 - e。- 高 , 如 果 来 自 此 总 体 容量 为 10 的 样本 如 下 : 
71,198 ,139 ,145 ,21 ,31 ,47 ,122 ,146 ,109. 
问 这 些 数据 是 否 来 自 均值 为 100 的 指数 分 布 ? 
为 了 回答 上 述 问题 ,我们 首先 利用 (7. 1.4) 来 计算 Kolmogorov-Smirnov 检 
RE D. 计算 D 值 的 R 程序 为 
X=c(71,198,139,145,21,31,47,122,146 ,109 ) 
Y=sort( X) ;M=0 
for(i in 1:10)1 
M[i]=max(i/10-pexp( Y[i],1/100) ,pexp(Y[i] ,1/100) —( i— 


max 





1)/10) 
| 
d=max(M ) # d 为 D 的 值 
经 过 计算 得 D = 0. 2637835. 
也 可 直接 调用 R 的 内 置 函 数 ks. test(X,"pexp" ,1/100) 得 到 
One-sample Kolmogorov-Smirnov test 
data: X 
D = 0.2638, p-value = 0.4173 
alternative hypothesis: two-sided 
我 们 也 可 以 通过 模拟 得 到 p 值 : 
exam7.2=function(n,d) | 
D=0;M=0 
forli in 1:n)| 
U =runif( 10) 
V =sort( U) 
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for(j in 1:10)1 
M[j]=max(j/10-V[j],V[j]-(j-1)Z10)] 
D[i]=max( M) 
l 
length(D[ D>=d])/n 
| 
运行 exam7.2(5000,d) 得 到 p 值 为 0.4208. 因为 p 值 很 大 ,所 以 应 该 接受 
原 假设 . 


7.2 . 含 未 知 参数 单 样本 的 拟 合 优 度 检验 


上 节 介 绍 的 对 随机 变量 的 分 布 进行 拟 合 优 度 的 检验 ,都 不 含有 未 知 参数 . 
本 节 将 对 含有 未 完全 指定 参数 的 概率 分 布 的 拟 合 优 度 检验 进行 介绍 . 
1. 离散 数据 情形 
如 果 要 拟 合 的 离散 型 随机 变量 了 的 分 布依 赖 于 7 个 参数 9, ,9,,… ,9,, 那 
么 我 们 提出 零 假设 
H,:Y 的 分 布 为 F(y;0, ,9,,… ,0,). 


解决 此 问题 的 步骤 是 : 

Step 1 : 先 通过 观测 得 到 样本 YY ,…,Y,. 

Step 2: 根 据 样本 Y, ,Y,,…,Y,, 利用 极 大 似 然 法 得 到 9, ,9, ,… ,6. 的 极 大 
似 然 估计 . | 

Step 3: 再 运用 上 节 所 介绍 的 拟 合 优 度 x 检验 法 对 假设 H,:Y 
的 分 布 为 Fy;9, ,6,,… ,9,) 进行 检验 . 

【 例 7.3】 根据 下 列 数据 

6,7,3,4,7,3,7,2,6,3,7,8,2,1,3,5,8,7 

检验 它们 是 否 来 自 一 个 参数 为 (8 ,p) 的 二 项 分 布 . 

假设 以 上 数据 来 自 总 体 X, 且 XX 的 分 布 为 8(8,p). B 

H,: 服从 二 项 分 布 B(8,p). 

根据 所 作假 设 有 似 然 函数 : 


L(p) =pZ"(1 ~p) Es = px(1 -pP 


uh r= L Y x. 解 以 下 似 然 方程 
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dlogL(p) _ nx _ n(m - x) 
dp P l -p 


得 到 的 极 大 似 然 估计 为 = 二 元 此 例 中 m= 8,E = 4.944444, b = 0. 6180555. 


根据 下 述 程序 可 计算 出 检验 的 p 值 . 
x=c(6,7,3,4,7,3,7,2,6,3,7,8,2,1,3,5,8,7) 
n=18 
N=c(0,1,2,4,1,1,2,5,2) # 样本 中 取 值 0 ~8 的 频数 
p=0 
p[1]=pbinom(0 ,8 ,0.6180555) 
for(i in 2:9)1 
p[i]=pbinom(i-1,8, 0.6180555 ) -pbinom(i-2 ,8 ， 0. 6180555) 


= 10， 


} 

Q=sum( (N-n *p)22/(n * p) )= 31.49933 

p ÍË = 1—pchisq( Q ,8)= 0.0001144661 ,从 而 有 理由 拒绝 H, El X — JE JA 
二 项 分 布 . 

现在 用 模拟 来 验证 上 述 检 验 的 p 值 ,其 步骤 如 下 : 

( i ) 指 定 模型 . 假设 数据 值 X, ,X,,… X 来 自 于 由 未 知 参数 6 ,9, ,… 0, 
确定 的 分 布 , 且 当 此 假设 为 真 时 , X, 的 可 能 取 值 是 0,1,… ,上 

( ji ) 参 数 估 计 . 用 数据 来 估计 未 知 参数 . 令 G RR 0 j= 1,2,…,m, 的 估 
计 值 . | 

Gii) fiit p, = P|X =i). Hi) HA 6 代入 所 假定 的 分 布 ,估计 出 1X = 
计 的 理论 概率 . 


(jiy ) 计 算 统 计量 Q 的 值 . Q = > 


Cab), push 和, 是 数据 值 等 


i = 0,1,…,k, 的 个 数 ,i 表示 检验 统计 量 Q 的 值 . 

(Y ) 模 拟 . 现 做 一 系列 的 模拟 来 估计 检验 的 p 值 . 当 零 假设 为 真 且 b 等 
于 其 在 (这 ) 步 所 确定 的 估计 量 9,j = 1,2,…,m, 时 ,总 体 分 布 得 到 确定 ,然后 
用 总 体 的 分 布 来 进行 模拟 . 


模拟 一 个 样本 容量 为 n, 来 自 于 上 述 的 总 体 分 布 ,并 令 8, (sim) 表示 0， 
7 = 1,2,…,m, 的 基于 模拟 数据 的 估计 量 . 现在 确定 如 下 统计 量 的 值 : 
+ (N, - n P: (sim) )° 


Q im) = > 


= n p; (sim) 
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其 中 N. 是 模拟 数据 等 于 i,i = 0,1,…,k, 的 个 数 , 当 0, 等 于 (sim) j = 1, 
2,…,m, 时 , p, (sim) 是 p, 的 估计 量 . 
重复 模拟 多 次 . p 值 的 估计 量 等 于 Qoi > 1 的 比例 . 
现在 我 们 根据 上 述 步 又 对 例 7.3 中 的 p 值 进行 验证 ,其 R 程序 为 
exam7. 3. 2 =function(m,t) | 
Q=0;N=rep(0,9) 
for(iin 1:m)| 
p=0. 6180555 
Y =rbinom(18,8,p) 
p=mean(Y)/8 
N=table( cut( Y,br=(-1):8)) 
q=0 
q[1] =pbinom(0,8, p) 
for(j in 2:9) | 
q[j] =pbinom(j-1,8, p)-pbinom(j-2,8, p) 
l 
Q[i]=sum((N[]-18 *q)°/(18 *q)) 
| 
length( Q[ Q>=t] )/m 
| 
”运行 exam7.3.2(10000 ,31.49933 ) 得 到 p 值 为 0.0107, 仍然 拒绝 H,, ËBll 
X ABR) my. 
2. 连续 数据 情形 


如 果 要 拟 合 的 离散 型 随机 变量 了 的 分 布依 赖 于 r 个 参数 9, ,6, ,…,6,, BE 

么 我 们 提出 零 假 设 
盏 :了 的 分 布 为 PC7y;g ,90,,… ,9,). 

解决 此 问题 的 步骤 是 

Step 1 : 先 通过 观测 得 到 样本 Y, ,于 ，……, 工 . 

Step 2 :根据 样 本 了 ,7,,…,Y,, 利用 极 大 似 然 法 得 到 0 = (0 ,6,,… ,90,) 
的 极 大 似 然 估 计 9 = (8, ,0,,… ,06,). 

Step 3; 表 运用 上 节 所 介绍 的 拟 合 优 度 Kolmogrov-Smirnoy 检验 法 对 假设 
:了 的 分 布 为 F(y;0,, 抽 ,… 0.) 进行 检验 . 

注意 ,在 此 处 运用 Kolmogrov-Smirnov 检验 法 时 ,.D = max, | F.(x) - 
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F;(x) | ,其 中 F.(x) 为 由 观测 值得 到 的 经 验 分 布 函 数 , F;(x) 由 将 6 代入 分 
布 函数 F(x;6) 而 得 到 . 

【 例 7.4】 某 班 有 70 名 学 生 , 其 成 绩 如 下 : 

61 ,74 ,61 ,66 ,82 ,67 ,60 ,71 ,68 ,65 ,74 ,66 ,80 ,88 ,86 ,70 ,88 ,89 ,68 ,60 ， 

67 ,85 ,81 ,87 ,71 ,71 ,78 ,93 ,90 ,88 ,72 ,80 ,89 ,80 ,93 ,90 ,90 ,86 ,95 ,87 ， 

92 ,57 ,63 ,76 ,68 ,62 ,85 ,66 ,64 ,49 ,78 ,60 ,69 ,65 ,83 ,89 ,89 ,86 ,93 ,76 ， 

93 ,90 ,62 ,79 ,76 ,69 ,74 ,76 ,87 ,67. 

试 检 验 此 班 的 学 生 的 成 绩 了 服从 正 态 分 布 N(j,o?). 

我 们 假设 H,:X RJ. N(u,o2). 在 有 下 ,得 到 似 然 函 数 为 


L(u,o2) = oox > (x =y) l 


20° 
解 如 下 似 然 方程 : 
dlogL( ,0) _ > (x - u) -o 
ðu o? ; 
logL(ps0)_ n ， a -u) -o 


ðo’ 20° 20° 
AAA =X, = 二 也 (Xi - X). 因为 二 加 (X, - X) RE o 的 无 偏 估计 ， 


=1 i= 


将 之 修正 为 样本 方差 5 = -下 也 -D 将 观测 数据 代 人 上 式 ,得 到 舍 


计 值 为 上 = 76. 57143, G° = 128. 5383. 计算 D 的 值 的 R 程序 为 
A =table( cut( X ,br=c(40,59 ,69,79,89,100) ) ) 
mu = mean ( X) ;sigma=sd( X) 
br=c(40,59 ,69 ,79 ,89 ,100) 
N=A[ ] 
M=0 f 
M[1]=max(sum(N[1])Zlength( X) —pnorm(59 ,mu,sigma) ) 
for(j in 2:5)1 

M[j]=max(sum(N[1:j])Zlength( X) —pnorm( 59 ,mu,sigma) ， 

pnorm(59 ,mu,sigma)—sum(N[1:(j-1) ])Zlength( X) ) 
} 
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d=max( M) 
得 到 d = 0. 9394117. 
现在 可 通过 模拟 来 求 出 p 值 ,程序 如 下 : 
exam7.4pvalu=function( m) | 
d=0 
for(iinl:.m)! 
X=rnorm(70,76.57143 ,11.33747) 
X=rnorm(70,mean( X) ,sd( X) ) 
A=table(cut(X,br=c(0,59,69,79 89,100) ) ) 
N=A[];M=0 
M[1] =max(sum(N[1])/length(X) -pnorm(59 ,mu,sigma) ) 
for(j in 2:5)| 
M[j]=max(sum(N[1:j])Zlength( X)—pnorm(59,mu,sigma) , 
pnorm(59,mu,sigma)—sum(N[1:(j-1)])Zlength(X) ) 
l 
d[i] =max( M) 
} 
length( d[ d>=0.9394117])/m 
| 
运行 exam7.4pvalu( 10000) 4$ 2] p [X 0. 2891. 当然 也 可 直接 调用 内 置 R 函 
数 得 到 : 
ks. test( X," pnorm" ,76. 57143 ,11. 33747) 
One-sample Kolmogorov-Smirnov test 
data: X 
D = 0.1285, p-value = 0.1978 
alternative hypothesis: two-sided 
也 可 用 Pearson y 检验 ,程序 如 下 : 
A=table(cut(X,br=c(0,64 ,69 ,79 ,89 ,100) ) ) 
br=ec(0,64 ,69 ,79 ,89 ,100) 
q=0 . 
p= pnorm( br[ -1] ,76. 57143 ,11. 33747) 
q=c(p[1],p[2]-p[1],p[3]-p[2],p[4]-p[3],1-p[4]) 
chisq. test( A,p=q) 
运行 上 述 程序 得 到 : 
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Chi-squared test for given probabilities 
data: À 
X-squared = 6.0523, df = 4, p-value = 0.1953 
根据 上 述 的 p 值 都 大 于 0. 05 ,应 该 接受 H,, 即 认为 此 班 的 学 生成 绩 服从 
正 态 分 布 . | 
一 般 来 说 ,Kolmogorov-Smirnov 检验 不 需 将 样本 分 组 , 少 了 任意 性 ,所 以 
Kolmogorov-Smirnov 检验 比 Pearson y 检验 更 有 效 . 


7.3 两 样本 问题 


假定 有 两 个 独立 的 观测 样本 X, ,X,,… ,X, 和 页 ,于 ,我们 要 检验 
这 两 个 样本 是 否 服 从 同一 分 布 .于 是 我 们 提出 零 假设 : 
本 :这 nn +m 个 随机 变量 是 独立 同 分 布 的 . 
这 个 统计 假设 检验 问题 被 称 为 两 样本 问题 . 
为 了 检验 ,将 这 n+m 个 值 XX X... ,X,Y ,了 ，… ,了 ,进行 排序 ,并 暂 
时 假定 所 有 的 n+m 个 值 是 不 同 的 ,从 而 次 序 是 唯一 的 .对 i=1,2,…,n, 令 R, 
表示 X, 在 这 n+m 个 值 中 的 秩 , 也 就 是 ,如 果 X, 是 在 n+m 个 值 中 第 j 小 的 值 ， 


则 R, =j. 统计 量 R = > R, 为 第 一 个 数据 集 的 秩 的 和 ,这 个 量 被 用 来 作为 我 们 


的 检验 统计 量 . (这 两 个 数据 集中 的 任何 一 个 都 可 以 看 做 “第 一 个 ”数据 集 . ) 

如 果 R 非常 大 ,表明 第 一 个 数据 集 趋向 于 比 第 二 个 数据 集 大 , 或 者 R 非 
常 小 ,表明 第 一 个 数据 集 趋向 于 比 第 二 个 数据 集 小 , 则 拒绝 零 假设 ;否则 接受 
零 假设 . 当 RR 的 观测 值 为 r- 时 ,如 果 PutR<r RE P, | R > r) 非常 小 ,我 们 
拒绝 零 假设 ,否则 接受 零 假设 . 此 检验 被 称 为 两 样本 的 秩 和 检验 ,或 者 称 为 
Wilcoxon 两 样本 检验 以 及 Mann-Whitney 两 样本 检验 . 事实 上 ,检验 数据 导致 
R =r 的 p 值 也 可 写 为 

p Ë =2min(P, IR < r}, Pa R > r|)- (7.3.1) 

这 是 因为 当 RR 太 小 或 者 太 大 时 我 们 都 拒绝 H, 所 以 p 值 是 这 两 个 情形 的 概率 
的 最 小 值 的 2 倍 . 例如 ,假设 r,(r* ) 使 得 在 假设 H, 下 获得 一 个 不 大 于 (不 小 
于 ) r, (r) 的 概率 为 0.05. 因为 在 有 ,下 每 个 事件 发 生 的 概率 是 0.05 ,所 以 当 
结果 是 7r. (或 者 是 r+”) 时 ,p 值 为 0.1. 

根据 (7.3.1) , 当 所 有 的 数据 不 同时 , 令 

已 , (r) = P, IR =< r]. 

为 了 计算 P. 。(r) , 我 们 将 得 到 一 个 递归 方程 . 
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如 果 最 大 的 值 确实 被 包含 在 第 一 个 数据 集 ,此 数据 集 的 秩 和 等 于 m + m 
(最 大 值 的 秩 ) 加 上 其 他 的 n - 1 个 来 自 于 此 数据 集 的 秩 和 ,车 第 一 个 数据 集 
中 和 镜 下 的 n -1 个 元 素 的 秩 和 不 大 于 r-n-m 时 , 则 此 数据 集 的 秩 和 是 不 大 于 
r, 这 个 情形 以 概率 Prin — n - m) 发 生 . 根据 类 似 的 讨论 ,我 们 能 够 证 明 如 
果 这 个 最 大 值 包含 在 第 二 个 数据 集 , 则 第 一 个 数据 集 的 秩 和 以 概率 P... (r) 
小 于 或 等 于 r. 最 后 ,因为 最 大 的 值 可 能 为 n+ m 个 值 中 的 任何 一 个 ,所 以 这 个 


最 大 值 以 概率 一 = 一 为 第 一 个 数据 集 的 成 员 . 综 上 所 述 , 得 到 下 述 递归 方程 : 





n +m 
P..(r) = Pn - n - m) + — P... (r). (7.3.2) 
上 式 可 由 如 下 边界 条 件 确定 ， 
PaT kso A Dfi po 


(7.3.2) 能 够 递归 的 解 得 到 P. (r) =P, IR Sr) E P, (r - 1) = 1 - Pa 
IR > r|. 
【 例 7.5】 测定 两 个 马铃薯 品种 的 淀粉 含量 (% ) 各 5 次 ,品种 A 和 品种 
B 观察 值 如 下 : 
A: 12.6, 12.4, 11.9, 12.7, 13.0; 
B: 13.4, 13.1, 13.5, 12.7, 13.6. 
试 在 显著 性 水 平 为 a = 0. 05 时 检验 两 品种 的 淀粉 含量 有 无 显著 区 别 . 
首先 提出 零 假 设 :两 品种 的 淀粉 含量 的 分 布 相同 . 将 马铃薯 品种 A 和 
品种 B 的 观测 值 进行 排序 , 见 表 7-2. 


表 7-2 










12.6 






12.7 






12.7 





3 4.5 4.5 


通过 用 下 述 程序 先 求 出 4 的 观测 数据 的 秩 和 : 
X=c(12.6, 12.4, 11.9, 12.7, 13.0) 
Y=ce(13.4,13.1,13.5,12.7,13.6) 
Z=c(X,Y) 
sum(rank(Z)[1:5]) 

得 到 7 = 16.5. 再 用 下 述 程 序 得 到 p 值 : 


exam7. Sp=function(n,m,r) | 
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p=function(n,m,r) | 
if(n==1& m= =0)| if(r<=0) P=0 else P=1 
| 

else ifín==0& m= =1)| if(r<0)| P=0 | else P=1 

| 

else if(n<0 || m<0) | P=0 | 

else 

P=n/(ntm) * Recall(n-1,m,r—n—m)+m/(n+m) * Recall (n,m-1 ,r) 

return( P) 

| 

pvalue=2 *min(p(n,m,r),1-p(n,m,r-1)) 

pvalue 

| 
运行 程序 exam7.5p($,5,16.5) 得 到 p 值 为 0.03174603. 据 此 ,拒绝 H,, 即 认 
为 这 两 种 马铃薯 品种 是 不 同 的 . 

运用 递归 式 (7.3.2) 计 算 p 值 所 需要 的 计算 量 随 着 样本 容量 的 增加 而 变 
得 巨大 . 例如 , 取 n=m = 20, 即使 我 们 选择 的 检验 量 是 比较 小 的 秩 和 ,但 是 可 
能 要 计算 20 x 20 x 410 =164000 个 P, ,(r) KE. 因此 ,对 于 大 样本 来 说 ,运用 
递归 式 (7.3.7) 是 不 可 能 的 . 在 大 样本 情形 下 我 们 能 够 用 中 心 极限 定理 得 到 尺 
的 近似 分 布 ,也 可 用 模拟 算出 p 值 . 
为 了 得 到 RR 的 近似 分 布 ,考虑 在 H, 下 ,这 nn + m + X, XX, M Y, 

Y, ,2 Yn 的 值 中 ， 每 个 值 的 秩 服从 1,2,…,n + m 的 均匀 分 布 . 从 而 


n+m+l 

En [R] = Y En LR] snx Hnt, 
_(n+m)(n+m+1) 

Vary (R;) = p 


E, [RR,] = E, [R,E, [ R, | R,]] 


-Di [X 2) 


_(n+m+1)[3(n+m) + 2] 
7 12 , 





n+m+i 


Covn (R; BR) = En [R,.R,] - En [R JEn [R] = 一 一， 


S +m+1 
Var, (R) = > Vary (R,) + > Cova (R,,R,) = nm - — = 
= ij 


179 





统计 模拟 及 其 及 实现 — 





所 以 在 H。 下 , 当 n 和 m 充分 大 时 ,由 中 心 极限 定理 知 R 近似 服从 正 态 分 布 . 
即 , 当 H, AAR, A 
R-n(n+m+1)⁄2 
Vnm(n+m+1)/12 
因为 对 标准 正 态 随机 变量 W, q r < E[W] Bf, PIWS r] fü P|W > r) 的 最 
小 值 是 前 者 ,否则 是 后 者 ,从 而 当 n 和 m 不 太 小 时 (两 个 都 大 于 7 是 足够 的 )， 
我 们 能 够 得 到 R =r 的 p 什 为 





“^ N(0,1). 





2p12 . 共 < .n+m+l 
p =| Zb Æ TSEDI aas 
2P|Z >r], 否则 ， 
其 中 
.n+m+l 
. r-n haz 
r = 9 
Inm(n + m + 1) 
12 
2 为 标准 正 态 随机 变量 . 


【 例 7.6】 用 大 白鼠 做 不 同 饲料 喂养 所 增 体 重 的 比较 试验 , 先 将 大 白鼠 
按 性 别 、 月 龄 ,体重 等 配 为 10 对 ,再 把 每 对 中 的 两 只 大 白鼠 随机 分 配 到 高 蛋白 
组 或 低 蛋 白 组 ,喂养 8 周 得 到 增 重 (单位 :g) 的 观测 值 如 表 7-3 所 示 . 试 检验 两 
组 大 白鼠 的 增 重 是 否 有 显著 的 差异 . 





表 7-3 大 白鼠 体重 增 重 (单位 :g) 观 测 值 
高 蛋白 组 体重 X, 135 120 131 130 139 138 136 137 134 130 
低 蛋 白 组 体重 Y, 124 124 131 118 132 132 136 127 127 117 


首先 提出 零 假 设 : H,: 高 蛋白 组 与 低 蛋 白 组 大 白鼠 体重 增 重 无 显著 区 别 . 
将 XY,,Y ,i,j =1 ,2，…,10 混合 , 设 R 为 X, „X23 Xio # X.Y, 混合 后 秩 的 和 ， 
得 到 X, 在 混合 后 中 的 秩 如 表 7-4 所 示 . 








表 7-4 高 蛋白 饲养 的 大 白鼠 体重 增 重 观测 值 的 秩 
观测 值 x, 135 120 131 130 139 138 136 137 134 130 
# R, 15 3 10.5 8.5 20 19 16.5 18 14 8.5 


从 上 表 可 计算 出 高 蛋白 组 观测 值 的 秩 和 r = 133. 易 知 , ELR] = 105, 
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R-105 . _r- 105 
0. 03429373. 据 此 ,有 理由 拒绝 H,, BANE E 3 8 55 46 8 P 88 20. 918138 t 
大 白鼠 的 体重 的 增 重 有 显著 差别 . 

我 们 用 递归 式 (7.3.2) 得 到 精确 的 p 值 为 0.03546299, 与 0. 03429373 非 
常 接近 ,这 表明 当 n,m 充分 大 时 ,用 近似 正 态 分 布 进行 检验 的 效果 也 非常 好 ， 
而 且 也 很 容易 计算 . 

下 面 我 们 用 模拟 方法 来 计算 上 述 p 值 . 

Step 1:89 X, ,下 X, MY’, Y’, ,了 混合 后 记 为 Z.,i=1,2,…,n+t+m,， 
并 将 Z 排序 ,得 到 其 对 应 秩 . 

Step 2: 令 2 = 1,2,:- n +m ,对 应 的 秩 为 R,,i=1,2,…,n+m. 

Step 3: X} X; i = 1,2,…,n ,所 对 应 的 秩 求 和 , 记 为 

Step 4; 从 Ri,i=1,2,…,n+m ,中 随机 抽取 nn 个 数 , 令 其 和 为 RR. 


Var(R)= 175. $ Z= 








= 2.116601, 则 p = 2P|Z > r*] = 


Step 5: 重复 Sep 4 k K. 令 p = ESTL, p = HRZ, Wp 
2 * min{ pi ,ps|. 
其 R 程 序 如 下 : 


` exam7. 6sim=function(k,X,Y) | 
Z=c(X,Y);R=0 
n=length( X) ;m=length( Y) 
rk=rank(Z);r=sum(rk[1:n]) 
for(i in 1:k)| 
rksamp = sample ( rk ) 
R[i] =sum(rksamp[1:n]) 
| 
if(r<0.5 *n * (n+m+1)) 
p=2 *length(R[R<=r])Zk 
else p=2 * length( R[ R>=r])Zk 
p 
| 
运行 exam7. 6sim(100000 ,X,Y) 得 到 p 值 为 0. 03362. 
上 述 分 析 假定 所 有 的 n + m 个 数据 是 不 同 的 . 当 这 些 数据 中 某 些 有 相同 的 
值 时 ,我 们 取 等 于 这 个 值 的 若干 数据 的 秩 的 平均 . 例如 ,如果 第 一 个 数据 集 是 1， 
4,5, 第 二 个 数据 集 是 2,4,7, 那么 第 一 个 数据 集 的 秩 和 是 1 + 3.5 +5= 9.5. 
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两 样本 问题 的 推广 是 多 样本 问题 ,对 于 下 面 的 m 个 数据 集 


Xia Xia . Ximo 
Xaa X,, n X, ,, , 
X X X 


我 们 感 兴趣 的 是 检验 零 假设 M: BFS n = Y n, 个 随机 变量 独立 同 分 布 .对 两 


样本 秩 检验 的 推广 称 为 多 样本 的 秩 检验 (通常 称 为 Kmuskal-Wallis 检验 ). 其 
步骤 为 :首先 计算 出 所 有 个 数据 的 秩 ,然后 令 R,,i = 1,2,…,mm ,表示 来 自 于 
第 i 个 数据 集 的 所 有 n 个 数据 的 秩 和 . 在 零 假设 H, 下 ,假定 所 有 的 数据 是 不 
同 的 , 则 每 个 数据 的 秩 等 可 能 地 取 1,2,… ,n 中 的 任何 一 个 .我 们 有 
n+l 
E[R;] =n; x = 
由 上 式 知 ,多 样本 秩 和 检验 统计 量 为 
[a 一 n, 
=- TE 一 一 人 
易 知 R 小 表明 H, 是 合适 的 , 尽 大 表明 不 合适 , 则 拒绝 H. 如 果 玉 的 观测 值 
X R =r, JJ p 值 为 
p E =P, ÍR > r|. 
对 充分 大 的 n ,ns,…,n。 来 说 , R 近 似 服从 一 个 自由 度 为 m - 1 8052 At. E 
此 ,p 值 可 由 下 式 近 似 得 到 
p Ë = Pr 
【 例 7.7】 用 3 种 不 同 的 药剂 处 理 水 稻 种 子 , 发 芽 后 观测 到 苗 高 (单位 ; 
cm) 的 观测 值 如 表 7-5 所 示 . 检验 3 种 药剂 对 水 稻 种 子 的 效果 是 否 有 差异 ? 


表 7-5 苗 高 的 观测 值 










苗 ”高 
21 ,24 ,27 ,20 
20 ,18 ,19 ,15 
22 ,25 ,27 ,22 











首先 提出 零 假设 H,:3 种 药剂 对 水 称 种 子 的 效果 无 差异 . 将 各 组 样本 数据 
混合 后 由 小 到 大 排列 ,确定 各 个 数据 的 秩 Ri, 并 计算 各 组 的 秩 次 和 R,, 如 有 
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相同 的 数据 可 同 取 平均 的 秩 ,结果 如 表 7-6 所 示 . 


表 7-6 各 观测 值 的 秩 








苗 高 ( 秩 ) 
21(6) ,24(9) ,27(11.5) ,20(4.5) 





31 
20(4.5) ,18(2) ,19(3) ,15(1) 10.5 


22(7.5) ,25(10) ,27(11.5) ,22(7.5) 


计算 秩 和 统计 量 R 的 观测 值 


12 
r= Da n 7.221154, 


得 到 p 值 为 0.02703624. 据 此 ,有 理由 拒绝 H,, 即 认为 这 3 种 药剂 对 水 稳 种 
子 的 效果 有 显著 差异 . 

例 7.7 的 样本 容量 n = 12 并 非 充分 大 ,而 我 们 用 近似 分 布 计算 p 值 可 能 
会 比较 粗糙 . 下面 我 们 用 模拟 来 估计 5p 值 . 其 步骤 为 

Step 1: 令 XX,,i = 1,2,…,m, 表示 第 i 组 观测 值 向 量 , 将 其 混合 后 排序 . 

Step 2: 令 R 表示 第 i 组 数据 第 j 个 值 的 秩 , 令 R, 表示 第 i 组 数据 秩 的 和 . 


n + 11 ° 
12 < [a, - m] 
TEESI n; : 





Step 3 :计算 r = 





Step 4: 从 R,,i = 1,2,---,m,j = 1,2,.%,n;, 中 抽取 n = >n, 个 值 Yis 
i=l 


y, y, ZR = y, + y; +: +y, R, = t Yrs2 T lU 十 Yarn > R, = 


n+ 十 + Yat 





[R -nT 


Step 5 $e R= È n; 
Step 6: Æ% Step 4 和 Step 5 k IK ,TFR p = HRL 
其 R 程序 为 
exam7.7sim=function(k ,X1 ,X2 ,X3 ) Í 
Z=ce(X1,X2,X3);R=0;n=0;r=0 


n[ 1] =length(X1);n[2] =length(X2) 
n[3 ] =length( X3) ;m =3 ;nsum =sum(n) 
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rk=rank(Z); 
r[1]=sum(rk[1:n[1]]) 
for(iin2:m){ r[i] =sum(rk[ (sum(n[1:(i-1)])+1) :(sum(n 
[1:i]))]) | i 
rsum =12/( nsum * (nsum+1)) * sum( (r-n * (nsum+1)/2)2/n) 
for(iin 1:k)| 
rksamp =sample( rk ) 
r[1] =sum(rksamp[1:n[1]]) 
for(j in 2:m) | r[j] =sum(rksamp[ (sum(n[1: (j-1)])+ 
1):(sum(n[1:j]))]) | 
R[i]=12/(msum * (nsum+1)) * sum( (r-n * (nsum+1)/ 
2)*/n) 
| 
length( R[ R>=rsum ] ) Zk 
} 
运行 exam7. 7sim(1000,X1,X2,X3) 1000 次 得 到 p ÈX 0.01433. 据 此 ,这 也 
表明 要 拒绝 H, 同样 认为 这 3 种 药剂 对 水 稻 种 子 的 效果 有 显著 差异 . 


7.4 验证 非 齐 次 Poisson 过 程 的 假设 


考虑 一 个 数学 模型 ,此 模型 假定 每 天 来 到 者 按照 一 个 非 齐 次 的 Poisson 过 
程 到 达 一 个 系统 ,每 天 的 来 到 过 程 是 独立 同 分 布 的 ,但 未 指定 强度 函数 . 

为 了 验证 这 个 假设 ,假定 我 们 对 此 系统 观察 了 m 天 的 来 到 时 间 . 令 WN,,i= 
1,2,…,m, 表示 在 第 i 天 的 来 到 数 ,并 注意 到 如 果 来 到 的 过 程 确实 是 非 齐 次 
的 Poisson 过 程 ,这 些 量 是 独立 的 且 具 有 同样 均值 的 Poisson 随机 变量 . 因此 这 
个 结果 能 够 利用 Pearson y 拟 合 优 度 方 法 进行 检验 . 在 此 根据 Poisson 随机 变 
量 的 均值 和 方差 相等 的 性 质 提出 另 一 个 更 有 效 的 检验 方法 . 如 果 N. 确实 是 来 
自 一 个 Poisson 分 布 的 一 个 样本 ,那么 样本 均值 


Dy N, 
和 样本 方差 


大 致 相等 . 据 此 我 们 提出 下 述 假设 : 
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Ha: N, 是 独立 的 且 具 有 同样 均值 的 Poisson 随机 变量 ,i = 1,2,… ,m. 
在 此 假设 下 ,我 们 构造 统计 量 : 

r= Š. 

N 

因为 当 了 的 值 很 大 或 者 很 小 时 ,都 表明 样本 均值 与 样本 方 益 有 显著 差异 ,说 明 

样本 N;,i=1,2,…,m ,不 是 来 自 同 一 分 布 . 对 于 给 定 的 观测 值 ,我 们 可 以 计算 

出 统计 量 7 值 为 1, 其 对 应 的 p 值 为 
Pi = 2min( Pp, IT <: Pun IT > 11). 
然而 ,因为 Ha 没有 指出 Poisson 分 布 的 均值 ,所 以 不 能 直接 地 计算 上 述 概率 . 


因此 我 们 首先 用 观测 数据 来 估计 此 均值 , 即 用 估计 量 N = À 作为 Poisson 分 布 
均值 的 估计 ,进而 得 到 p 值 的 估计 为 
pi =2min(P [T < tl ,P IT > t|), 

式 中 了 是 根据 式 (7.4.1) 而 定义 的 ,其 中 N,N,,…,N。 是 相互 独立 的 具有 均 
TEX A 的 Poisson 过 程 .我们 现在 通过 模拟 来 估计 PT<t AP, T= t. 也 
就 是 ,我 们 连续 地 产生 m 个 独立 的 且 具 有 均值 A 的 Poisson 随机 变量 ,并 计算 
了 的 值 . 将 模拟 结果 满足 7 < 1 所 占 总 模拟 次 数 的 比例 作为 P17 < :| 的 估计 
量 , 并 将 模拟 结果 中 满足 7 > 1 所 占 总 模拟 次 数 的 比例 作为 Pi7T > :| 的 估计 
E. 


(7.4.1) 


18 38065 p, 很 小 ,我 们 就 拒绝 零 假 设防 , 即 认为 日常 来 到 过 程 不 构成 
一 个 Poisson 过 程 . 然而 ,如果 p, 不 小 ,这 仅仅 意味 着 每 天 来 到 数 服 从 Poisson 
分 布 这 个 假设 是 可 行 的 ,而 据 此 不 能 识别 更 强 的 假设 Ho :实际 来 到 模式 是 非 
FK Poisson 过 程 , 且 每 天 都 是 相同 的 . 为 了 验证 此 假设 Ha, 我 们 进行 m 天 的 
观测 I X Xart ,Xn 为 在 第 j,i = 1,2,…,m ,天 各 个 来 到 者 到 达 的 时 间 . 
如 果 来 到 过 程 确实 是 一 个 非 齐 次 的 Poisson 过 程 , 则 能 够 看 出 这 m 个 数据 集 
X, „X2 xy "° Xino] =1 2... |, m ,是 相互 独立 的 且 具 有 共同 分 布 的 随机 变量 . 
从 而 可 用 多 样本 的 Kruskal-Wallis 秩 检验 对 Ho 进行 检验 . 其 步骤 为 
Step 1: 计 算 N = Y 几 个 数据 的 秩 
Step 2: 令 R, 表示 所 有 的 来 自 于 第 7 个 数据 集 的 N, 个 数据 的 秩 和 . 
Step 3 : 记 
N, (N+1)\? 
k 


R 2 





12 
= NOV) N, (7.4.2) 
MUJ R #E H, FEMER AAEN r - 1 80 y 分布. 
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Step 4 :根据 观察 值 计 算 R 的 值 为 r, 则 p 值 为 . 

Pa = 2min(P, (R < r}, Pan [R > r|) = 2min(P|y;, < r}, Pia > rl). 
如 果 上 述 p, 以 及 前 面 的 p, 都 不 太 小 ,我 们 可 以 推断 数据 与 日 常 来 到 数 构成 一 
个 非 齐 次 的 Poisson 过 程 这 个 假设 是 一 致 的 . 

注 :在 多 样本 秩 和 检验 中 ,一般 用 单 边 的 区 域 R 宇 +r 来 计算 p 值 ,而 在 此 处 
用 双边 区 域 R > r sü R < r 来 计算 (7.4.2) 中 的 P 值 .这 是 因为 一 个 多 样本 
秩 和 检验 假定 数据 来 自 m 个 分 布 且 这 些 分 布 相等 时 , R 应 该 较 小 ,所 以 应 该 
用 区 域 R > r 来 检验 .但 是 ,对 于 一 个 周期 的 非 齐 次 的 Poisson 过 程 ,我 们 既 要 
检验 第 i 天 的 各 个 来 到 时 间 服 从 某 些 分 布 ,又 要 检验 每 天 的 来 到 时 间 的 分 布 
是 相同 的 . 而 比较 小 的 R 的 值 表 明 在 每 天 中 来 到 的 次 数 有 同样 的 Poisson 分 
TRKE R 的 值 说 明 每 天 内 各 个 来 到 时 间 可 能 不 是 独立 同 分 布 的 ,也 就 是 
Poisson 过 程 是 非 齐 次 的 ,所 以 用 双边 区 域 R > + 或 者 R < rr 来 检验 . 

“【 例 7.8】 假定 记录 了 某 路 口 6 天 从 早上 8 点 到 下 午 6 点 这 10 个 小 时 
内 所 经 过 的 货车 次 数 及 时 刻 如 表 7-7 所 示 . 根据 此 观测 数据 检验 每 天 的 过 往 
货车 次 数 服从 非 齐 次 的 Poisson 过 程 . 


表 7-7 过 往 货车 次 数 及 时 刻 表 





f N, =51 
0.118, 0.173, 0.184, 0.224, 0.346, 0.447, 0.576, 0.755, 0.928, 0.952, 1.366, 
1.445, 1.527, 1.700, 1.713, 1.999, 2.046, 2.081, 2.484, 2. 548, 2. 634, 2.679, 
2.771, 2.943, 3.122, 3.222, 3.588, 3.592, 3.931, 4.452, 4.606, 4. 619, 4.677, 
4.797, 4.922, 4.922, 5.022, 5.414, 5.513, 5.817, 6.584, 6.938, 6.978, 6. 994, 
7.124, 7.172, 7.321, 7.344, 8. 890, 9. 162, 9. 544 
N, =40 














0.159, 0.305, 0.392, 0.403, 0.417, 0.684, 0.814, 0.982, 1.093, 1.235, 1.384, 
1.493, 1.592, 1.705, 2.318, 2.471, 2.640, 2.756, 3.120, 3.302, 3.320, 3.682, 
3.688, 4.205, 5.093, 5.185, 5.585, 5.695, 6.677, 7.065, 7.213, 7.545, 7.824, 
8.099, 8.260, 8.690, 8.785, 8.918, 9.612, 9.972 








N, =37 
0.100, 0.294, 0.386, 0.727, 0.780, 1.048, 1.245, 1.304, 1.352, 1.829, 1.992, 
2.156, 2.632, 2.636, 2.767, 2.795, 3.037, 3.281, 3.690, 3.696, 4.581, 4.905, 
5.083, 5.640, 6.116, 6.460, 6.979, 7.249, 7.473, 7.659, 7.867, 8.029, 8.682, 


8.915, 8.982, 9.183, 9. 286 
| 
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续 表 


N, = 36 


0.138, 0.234, 0.908, 0.939, 0.990, 1.266, 1.589, 1.952, 2.068, 2.361, 2.710, 
3. 501, 3.513, 3.967, 4.367, 4.451, 4.984, 5.157, 5.528, 6.551, 6. 658, 7. 432, 
7.755, 8.021, 8.061, 8.170, 8.288, 8.325, 8.337, 8.427, 8. 655, 8. 836, 8.895, 
8.921, 9.235, 9.343 





N, =32 





0.161, 0.681, 0.714, 1.848, 1.914, 1.940, 1.995, 2.139, 2.329, 2.581, 3.390, 
3.484, 3.629, 3.662, 3.933, 4.419, 4.422, 4. 864, 5.358, 5.913, 5.985, 6. 106, 
6.951, 6.969, 7.215, 7.275, 7.342, 7.372, 8.432, 8.665, 8.706, 9. 120 





N, =32 


0.078, 0.207, 0.217, 1.142, 1.415, 1.436, 1.530, 1.879, 2.207, 2.779, 3.050, 
3.632, 3.657, 3.929, 4.532, 4.750, 5.174, 5.396, 6.386, 7.123, 7.291, 7.362, 
7.513, 7.625, 7.789, 7.947, 8.136, 8.166, 8.280, 8.984, 9.788, 9. 890 


首先 提出 零 假设 H, : 过 往 的 货车 数 N 服从 Poisson 分 布 .计算 N = 38, 
S° = 50, 得 到 了 的 观测 值 为 上 = 1.32. 调用 下 述 程序 : 
exam7. 8 =function(t,n,m, mu) | 
T=0 
for(i in 1:n) į 
N=rpois(m,mu) 
T[i] =var( N)/mean( N) 
} 
2 * min(length( TÍ T>=t] )/n,length( T[ T< =t] )/n) 
} 
通过 运行 exam7.8(1. 32,10000,6,38) 得 到 p 值 为 0.506. 据 此 ,接受 
Ho, 即 过 往 的 货车 数 N 服从 Poisson 分 布 . 
继续 提出 零 假设 H, :每 天 过 往 的 货车 数 NN;,i=1,2,… ,6, 为 相同 的 非 齐 
次 的 Poisson 过 程 .将 所 有 的 观测 时 刻 排 序 ,得 到 每 天 的 过 往 货 车 时 刻 的 秩 和 
如 表 7-8 所 示 . 
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表 7-8 过 往 货 车 时 刻 的 秩 和 
秩 和 R, R, R, R, R, R, 
观测 值 5042 4258 4158 4792 3836 4020 


TI n = N, + N, +- + N, J| n = 228. 计算 统计 量 尺 的 观测 值 


n (R - - N,- 2+1) 


2 
r= TÈ — 49, 


N, 





得 到 
p. = 2min( P|y2., < 7.49] Pix, > 7.49] ) = 0.374, 
由 此 接受 Ho, 即 认为 过 往 的 货车 数 N 服从 非 齐 次 的 Poisson 过 程 . 
如 果 一 个 非 齐 次 Poisson 过 程 通 过 检验 认为 是 与 数据 一 致 的 ,那么 我 们 接 
着 就 要 对 此 过 程 的 强度 函数 和 A(1) ,0 < :< 了 进行 估计 . 在 齐 次 情形 下 ,显然 强 


度 函 数 的 估计 量 是 和 (1) = 信 , 其 中 人 是 在 长 度 为 了 的 一 天 中 到 达 的 平均 次 数 


的 估计 量 . 对 非 齐 次 Poisson FH, iÉ n = Èn, “y =0, Xf k=1,2,- n, iË 


ya 8683 n PENEAN A k PRUMEL 因为 在 m 天 中 ,在 时 间 间 隔 O, 
a k=1,2,…,n 上 仅 有 一 个 来 到 ,所 以 A(1) 的 一 个 合理 的 估计 量 为 
1 
(y, 一 Ye-1) , 
为 了 保证 一 天 来 到 的 货车 数 的 数学 期 望 为 W, 所 以 取 强 度 函 数 
1 
m(y, 一 X,-4) , 


A(t) = 当 y < t < y,- 


À (t) = My, < t < Ye 
练 习 7 


1. 根据 遗传 学 理论 ,大 麦 的 杂交 后 代 关于 芒 性 的 比例 应 是 无 臣 : KË: 
短 芒 =9 : 3 : 4. 实际 观测 值 为 335 : 125 : 160. 试用 Pearson y 检验 和 模拟 估 
计 p 值 ,进而 判断 观测 值 是 否 符合 理论 假设 . 


2. 根据 Mendel 的 让 传 学 理论 ,一 种 开花 的 怠 豆 植物 将 分 别 以 概率 L, 


方才 开 白色 、 粉 红色 或 者 红色 的 花 . 为 了 检验 这 个 结论 ,对 564 BLS EE 


进行 研究 得 到 结果 如 下 : 141 个 开 和 白花 , 291 个 开 粉 红色 花 , 132 个 开 红 花 . 分 
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别 用 Pearson y 检验 和 模拟 的 方法 估计 此 数据 集 的 p 值 ,判断 此 数据 是 否 符合 
Mendel 的 遗传 学 理论 . 

3. 某 市 政局 为 了 考察 该 市 的 6 条 交通 要 道 是 否 具 有 同等 流量 ,分 别 对 这 
6 条 交通 要 道 进行 了 为 期 一 个 月 的 观察 ,得 到 每 条 要 道 的 车 辆 数 (单位 :万 辆 ) 
分 别 为 

157,164 ,165 ,182 ,163 ,169. 

试 分 别 用 Pearson y 检验 和 模拟 的 方法 估计 此 数据 集 的 p 值 ,判断 此 6 条 交通 
要 道 的 流量 是 否 相 同 . 

4. 有 人 对 一 份 取 值 于 10,1,… 9] 中 的 250 个 数字 的 随机 数 表 ,进行 了 如 
下 加 工 : 


数字 0 1 2 3 4 5 6 7 8 9 
观测 频数 17 31 29 18 14 20 35 30 20 36 





经 过 思考 ,他 认为 此 表 不 可 能 是 随机 的 . 试问 ,你 认为 他 的 怀疑 是 否 有 充 
分 的 统计 根据 ? 

5. 假设 以 下 18 个 点 的 集合 是 来 自 一 个 (20,40) 上 的 均匀 分 布 : 

36.4, 26.0, 31.2, 20.1, 39.9, 34.1, 29.5, 27.9 ,38.0, 
26.2, 35.7, 28.6, 24.9, 22.0, 21.7, 34.6, 38.2, 39.4. 
估计 此 假设 的 P 值 . 
6. 假定 从 一 批 电子 元 件 中 抽出 10 个 测量 出 其 寿命 如 下 (单位 :小 时 ) : 
66 ,72 ,81 ,94 ,112 ,116 ,124 ,140 ,145 ,155. 
问 这 批 电子 元 件 的 寿命 是 否 服从 指数 分 布 并 估计 此 假设 的 P 值 . 

7. 假设 在 30 天 的 时 间 段 内 ,有 6 天 没有 事故 发 生 , 有 2 天 有 一 起 事故 发 
生 , 有 1 天 有 2 起 事故 发 生 , 有 9 天 有 3 起 事故 发 生 , 有 7 天 有 4 起 事故 发 生 ， 
有 4 天 有 5 起 事故 发 生 , 有 1 天 有 8 起 事故 发 生 . 检验 这 些 数据 是 否 与 参数 

= s = 2. 9 的 Poisson 分 布 的 假设 一 致 

8. 产生 20 个 相互 独立 的 具有 均值 为 1、 方 差 为 4 的 正 态 随机 变量 的 值 . 
试 利用 Kolmogorov-Simrnov 方法 ,估计 此 模拟 数据 确实 是 来 自 于 均值 为 1、 方 
差 为 4 的 正 态 分 布 的 p Ë. 

9. 对 一 台 设 备 进 行 寿命 检验 ,记录 10 次 无 故障 工作 时 间 ,并 按 从 小 到 大 
的 次 序 排列 如 下 (单位 :小 时 ) : 
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420 ,500 ,920 ,1380 ,1510 ,1650 ,1760 ,2100 ,2300 ,2350. 
试用 Kolmogorov- Simirnov 检验 方法 检验 此 设备 无 故障 工作 时 间 的 分 布 是 否 服 


从 参数 为 A = 1500 的 指数 分 布 ,用 模拟 估计 出 此 假设 的 p i. 


10. 为 了 比较 两 种 品种 的 水 稳产 量 ( 单 位 :kg) ,进行 田间 试验 ,得 到 亩 产 
量 如 下 : 

品种 1:446, 453, 451, 447, 447, 451, 453, 452, 444, 454; 

品种 2:494, 501, 503, 486, 498, 498, 492, 499, 501, 499, 495, 503. 
当 检 验 “ 假 设 : 这 两 种 品种 的 水 称 亩 产量 相同 "时 ,计算 精确 的 p 值 . 

11. 观察 得 两 样本 值 如 下 : 

样本 I 2.36,3.14,7.52,3.48,2.76,5.43,6.54,7.41; 

样本 了 4.38,4.25,6.53,3.28 ,7.21 ,6.55. 
在 分 析 这 两 样本 是 否 来 自 同一 总 体 时 ,分 别 用 渐 近 正 态 和 模拟 的 方法 计算 p 
值 . 

12. 考虑 下 述 样本 的 数据 : 

样本 1 99.1,99.1, 95.9,94.0,97.8, 91.7, 98.0,97.2; 

样本 2 106.6, 104.4, 102.5, 109.6, 95.5, 98.1,108.8,105.1; 

样本 3 143,151, 146,148,165 ,103, 152, 100. 
当 检 验 所 有 的 数据 来 自 同 一 个 分 布 时 ,分 别 用 x? 统计 量 和 模拟 的 方法 计算 p 
值 . 

13. 某 ATM 机 在 100 个 单位 时 间 内 ,有 18 个 顾客 光临 ,其 到 达 时 刻 如 下 : 

12,20,33 ,44 ,55 ,56 ,61 ,63 ,66 ,70 ,73 ,75 ,78 ,80 ,82 ,85 ,87 ,90. 

试 检验 到 达 过 程 是 一 个 ( 齐 次 ) Poisson 过 程 并 估计 p 值 . 

14. 假定 记录 了 某 个 工厂 5 天 的 日 常 运输 次 数 . 在 此 阶段 每 天 的 运输 次 数 
WF: 

18,24,16,19,25. 
又 假定 根据 它们 到 达 的 时 间 安 排 102 次 的 运输 次 序 ,每 天 运输 的 秩 和 为 : 
1010 ,960 ,1180 ,985 ,1118. 

用 上 述 数据 ,让 我 们 检验 “假设 :日 常 运输 到 达 过 程 是 一 个 非 齐 次 Poisson 过 
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在 统计 领域 里 主要 有 两 大 类 计算 问题 ,一 类 是 极 大 似 然 估计 的 计算 , 另 一 
类 是 Bayes 计算 . 在 极 大 似 然 估计 计算 中 有 时 数据 是 缺失 的 ,我们 用 EM 算法 
进行 估计 .在 Bayes 计算 中 ,如 果 观 测 后 验 分 布 是 复杂 的 、 高 维 的 、 非 标准 的 分 
布 , 我 们 可 以 用 MCMC 方法 进行 处 理 . 下面 分 别 介绍 这 两 种 方法 . 


8.1 EM 算法 


EM ( Expectation-Maximization ) 算法 是 一 种 迭代 方法 ,最 初 由 Dempster 等 
提出 ,主要 用 来 求 后 验 分 布 的 众 数 ( 即 极 大 似 然 估计 ) , 它 的 每 一 次 迭代 由 两 
步 组 成 :E 步 ( 求 期 望 ) 和 M 步 ( 极 大 化 ) .一般 地 ,以 p(9|7) 表示 9 基于 观测 
数据 的 后 验 分 布 密度 函数 , 称 为 观测 后 验 分 布 , p(0 | Y,Z) 表示 添加 数据 Z 
后 得 到 的 关于 6 的 后 验 分 布 密度 函数 , 称 为 添加 数据 的 后 验 分 布 , p(Z | 0,Y) 
表示 在 给 定 9 和 观察 数据 了 Y 下 潜在 数据 Z 的 条 件 分 布 密度 函数 .我 们 的 目的 
是 计算 观测 后 验 分 布 p(0 | Y) 的 众 数 ,EM 算法 按 下 述 步 又 进行 . 记 e 为 第 
i+ 1 次 迭代 开始 时 后 验 众 数 的 估计 值 , 则 第 i+ 1 次 迭代 的 两 步 为 

E 步 :将 p(6|Y,2) sk logp(0 | Y,Z) 关于 2 的 条 件 分 布 求 期 望 ,从 而 把 2 
积 掉 , 即 
Qolo y) À E,[logp(0 | Y,Z) | 0?) ,7] = fogp (0 |Y,2)p(2 | 0® y)qZz. 

(8.1.1) 

M 步 :将 alo”, Y) 极 大 化 , 即 找 一 点 6” ,使 

Q? | ət Y) = maxQ(0 |6 y). (8.1.2) 
如 此 形成 了 一 次 迭代 9 一 oi. j$ ERE PAM ATERAZ 
he” -9 中 或 QC0" |a y) - 000 10 y) | 充分 小 时 停止 . 

【 例 8.1】 (Rao(1965) ) 设 有 197 种 动物 服从 多 项 分 布 ,将 其 分 成 四 类 ， 

观测 到 的 数据 为 | 
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y= (y, Y29334) = (125,18 ,20 ,34). 
再 设 属于 各 类 的 概率 分 布 为 

(去 + 3040 - 0) „Ha - 0) +) ， 
其 中 8 e (0,1) , 试 估 计 6. 


取 9 的 先 验 分 布 7(9) 为 (0,1) 上 的 均匀 分 布 , 则 0 的 观测 后 验 分 布 为 
p(0]Y)=@ zm(0)p(Y | 0) 


_ 1 1 yı 1 72 1 Y3 1 Y4 
-[z ++ 9) (#0-0) (70-0) (29) 
x (2 + 0)”(1 - 0)”2*23g%4, (8.1.3) 
S L(0,Y)= (2 + 9)"(1 — 0)>”*%g”* X L(0,Y) 取 对 数 后 再 对 6 求 导 得 
dlog L(0,Y) _ Yı _ a ty, Da 
db 2+0 1-9 0. 
d log L(0,Y) 、， 、 ¿ 、 、 
我 们 称 Aae 为 得 分 函数 , 记 为 S(0). 为 了 得 到 0 的 极 大 似 然 估 计 值 


6, 我 们 解 似 然 方 程 
S(0) = 0. 
用 如 下 R 程序 : 





S=function( x) L= l 1 +22 5) 


uniroot(S,c(0,1)) 
得 到 6 = 0. 6268219. 
TERNA EM 算法 来 求解 0. 现在 面 对 的 困难 是 在 (8. 1.3) 中 同时 出 
现 2+0,1-9 和 909, 为 了 将 2+9 拆 分 开 , 我 们 将 第 一 类 动物 分 为 两 小 类 , 落 于 
第 一 小 类 的 概率 为 o 落 于 第 二 小 类 的 概率 为 2 ， 引 进 潜在 变量 Z 表示 动物 


属于 第 一 小 类 的 种 数 , 则 y, - Z 为 动物 属于 第 二 小 类 的 种 数 . 从 而 得 到 9 的 添 
加 后 验 分 布 为 
p(0|Y,Z)e mr(0)p(Y,2|0) 
(a aA 0) ga o) "(Hy 
cc P — 0), 
在 第 i+ 1 次 选 代 中 假设 有 估计 值 9 , MaE E WA M 步 得 到 8 的 一 个 新 
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的 估计 .在 E 步 中 ,由 (8.1.1) 有 
Q(9|0° ,Y=E[(y, - Z + y,)log0 + (y, + y, )log(1 - 0) | 6° ,Y] 
=[y, - E,(Z | 0) ,Y) + y, ]log0 + (y, + ys )log(1 -6). 





G) 2 G) 2y, 
B Z |o 了 服从 B(s 7a) , 故 E,(Z 100 ,7) = 六 
在 M 步 中 ,我 们 将 0(616"”,Y) 对 6 求 导 并 令 其 为 0, 有 
gD = Yı + y, - E,(Z | 8? ,Y) 
y +y, +Y, + y, - E,(Z | 0? ,Y) 


_ 1590? + 68 
“19780 + 144 
根据 (8. 1.4) 编写 迭代 程序 如 下 : 
exam8. 1 = function(ep = 1e-7 ) { 


theta=0.5;k=1 


(8.1.4) 


repeat | 
k=k+1 
theta[ k] =(159 * theta[ k-1 ]+68)/ (197 * theta[ k-1 ] +144) 
if( abs( theta[ k ] -theta[ k-1 ] ) <ep) break 
} 
list( theta =theta[ k ] ,iter=k) 
| . 
运行 exam8. 1( ) 得 到 9 = 0. 6268215. 
【 例 8.2】 如 下 数据 
3. S4 ,3. 90 ,3. 93 ,5. 19 ,3. 58 ,4. 60 ,3. 85 ,4. 69 ,4. 29 ,4. 067 ,3. 77 ,3. 45, 
5. 36 ,2. 62 ,4. 80 ,4. 65 ,3. 65 ,3. 67 ,6. 23 ,3. 35 ,1. 58 ,-0. 19 ,—1. 89 ,0. 08, 
0. 34 ,0. 90 ,-0. 03 ,0. 55 ,-0. 57 ,-1. 20 
可 能 来 自 于 正 态 分 布 W(0,1) 与 N(u,1) 的 混合 ,混合 比 为 1 -p 与 p, 且 0 < 
p < 1. RH p 5 u 的 极 大 似 然 估计 . 
我 们 首先 给 出 其 混合 密度 : 
Fripe) =p(7 -1) +(1-P) 中 (7Y)， 


Let, 设 从 混合 分 布 中 抽取 样本 Y= (Y. ,Y,, Y.) EAR 


其 中 b) a 





似 然 函数 
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L(u,p;Y) = II oY; -HA) + (1 - p)#(Y,)). 
对 上 述 似 然 函 数 取 对 数 得 


t(j,p;Y) = 2 log(p$(Y, -MA) + (1 -— p)#(Y,)) 


考虑 
Əf(u,p;iY) _ o 
ðu (8.1.5) 
af(uP:Y) _ 0 
ðp , 


mi (8.1.5) 也 很 难 直接 用 数值 方法 得 到 其 解 . 下 面 用 EM 算法 来 分 析 . 
我 们 引入 潜在 变量 Z = (Z, ,.Z,, `. Z.) , 且 Z, QZ Z, 相互 独立 ,其 中 
z- [i , 若 了 ,来 自 正 态 分 布 N(p,1)， 
” lo, 车 了 来自 正 态 分 布 N(0,1)， 
以 及 P12Z,=1| =p,i=1,2,…,n. 我 们 有 Y|2Z,=1 ~ N(u,1), Y, | Z, =0 ~ 
N(0,1). MJ (Z,,Y,) ,i = 1,2,…,n 的 似 然 函 数 为 
LpspsY,2)= [[p $Y - a) 0 - p), E. 
对 上 述 似 然 函 数 取 对 数 并 去 掉 与 p,n 无 关 的 量 得 
EPZ = Ý Zilog -ŁY Z, - u)? + (r - X z Jiga =p). 


假设 在 第 k + 1 PRRP, AAE” ,P , PLE M 步 得 到 人 ,P 的 新 
HaT E ut. ， př”. 在 E 步 中 , 令 f 
Q(u,plut°,P 2 ,Y)= El £ (u,p; Y,Z) |u 9 pt ,Y] 


= 》 E,[Z, |u” ,p® ,Y]logp 
i=l 
1 n 
-FX ELZ |a 9 YIO, = a) 


+ (mn - > E,[Z, |a pt y])log(1 - p). 





易 知 
(k) (k) 
Z (trD = z. (k) (9 y - P (Y; ZH ) , 
i E,[ sla ‚P ] pP CY, -p™) + (1 - p” )o(Y,) 
在 M 步 中 , 解 
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plu” p” Y -六 pP, -u™) 
ou 


= p) bY, -pp ) + (1 pRB za) = 0, 
aQup lu” p Y) -Ts 








ly p” (Y, -Ke ) 
ap p £ pb( 和 -AD) + (1 - p) )0(Y,) 
_ 1 " pP, - a) ) _ 
1 z” T > pO(Y, -u®) +0 MOTTE =°, 
得 到 


中 (也 - p ) Y, 
ass) J! p) (Y, - t) + (1 _- p) 0(Y,) 





y> (Y; -p”) 
f pP pP(Y, — (D) + (1 - p'2”)0(Y,) 
(eeD 1 - p) (Y, - p”) 
P ë Fh > pP, -p™®) + (1 - p9)0(Y,)` 
编写 R 程序 如 下 : 


exam8. 2 =function( Y,ep=1e-5) Í 


phi =function(x)1/sqrt(2 * pi) * exp( -x°/2) 


p=0.6;mu=3.5;n=length( Y) 
k=1 


repeat | 


k=k+1 


p[k]=1/n*p[k-1] * sum(phi( Y-mu[k-1])Z(p[k-1] 
* phi( Y-mu[k-1])+(1-p[k-1]) * phi( Y) ) ) 
mu[k] =sum(phi( Y-mu[k-1]) * Y/(p[k-1] * phi ( Y — 
mu[k-1]) 


+(1-p[k-1]) * phi ( Y) ) )Zsum ( phi ( Y —mu [ k- 
1])/(p[k-1] * phi( Y-mu[k-11]) 


+(1-p[k-1]) * phi(Y))) 


if(abs(p[k]—-p[k-1])<=ep&abs(mu[k] -mu[k-1]) <= 
ep) break 


| 


list(p=p,mu=mu,iter=k-1) 


! 


运行 exam8.2(Y,ep=le-5) 得 到 人 和 的 估计 分 别 为 4.13 和 0. 6728. 
EM 算法 的 最 大 优点 是 简单 和 稳定 .EM 算法 的 最 大 目的 是 提供 一 个 简单 
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的 选 代 算 法 来 计算 后 验 众 数 ( 或 MLE) .我 们 不 禁 要 问 ,EM 算法 得 到 的 佑 计 序 
列 收敛 吗 ? 如 果 收 敏 ,其 结果 是 否 为 p(b | Y) 的 最 大 值 或 者 为 局 部 最 大 值 . 为 
此 ,我 们 给 出 下 述 两 个 定理 . 为 了 叙述 方便 , 记 估 计 序 列 为 9 i= 1 ,2，…， 
L(0 | Y) = logp(0 | Y). 
定理 8.1 EM 算法 在 每 次 和 迭代 后 均 提 高 后 验 分 布 密度 函数 值 , 即 
p(0°*U | Y) > p(0%°? | y). (8.1.6) 
证 由 乘法 公式 有 
p(0,Z|]Y)=p(Z|0,Y)p(0| Y)=p(0|Y,Z)p(Z| Y). 
将 上 式 后 两 项 取 对 数 有 
logp(0| Y) = logp(0 | Y,Z) + logp(Z | Y) - logp(Z | 0,Y). (8.1.7) 
设 现 有 估计 8” , 将 上 述 对 Z 关于 对 p(Z | 0 ,了 ) 求 期 望 ,有 
logp(0 | Y)= f[logp(0 | Y,Z) ~ logp(Z | 0,Y) + logp(Z | Y) ]p(Z|0® ,7)dZ 
会 0(9162 ,7) - H(0| 0) Y) + K(0® Y), 
(8.1.8) 
H Qolo” ,Y) # (8.1.1) 中 定义 ， 


H(0 |0” Y) = flogp(Z l0, Y)p(Z |a ,Y)aZ, 


K(06® ,了 ) = flogp( Z | Y)p(Z | 6? ,7)d2. 


分 别 在 (8.1.8) 中 取 6 为 g92 和 6465 并 相 减 ,有 
logp(0°* | Y) -logp(g9 |y)=[Q(0|8% y) - Q(0| 0°? ,7)] 
-[H(0|]0%*) y) - H(0| 0 ° ,7)]. 
H Jensen 不 等 式 , 知 


E, [10e e E Ee) | 6 可 < h [|,e D 16@ .了 ! = 0. 


#KCH(0|0,Y) - H(0| 0) ,Y) <0. 又 09"*? EE Q(0 | 0) Y) 达 最 大 的 ， 
故 
Q(0|10* y) - Q(0| 0°) Y) > 0. 

所 以 (8.1.6) 成 立 . 

定理 8.2 (1) 如 果 P(617) BER, WLO | Y) KAARI L. 

. (DMR Q(919) 关于 9 和 9 都 连续 , 则 在 关于 工 的 很 一 般 的 条 件 下 ,由 

EM 得 到 的 估计 序列 0) 的 收敛 值 9 是 工 的 稳定 点 . 

证 由 定理 8. 1 及 单调 收敛 定理 易 知 论断 (1) 成 立 .论断 的 证 明 参 见 Wu 
(1983) 定理 1. 
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定理 8.2 表明 EM 算法 的 结果 只 能 保证 收敛 到 后 验 密度 函数 的 稳定 点 ， 
并 不 能 保证 收敛 到 极 大 值 点 .事实 上 ,任何 一 种 算法 都 很 难保 证 其 结果 为 极 大 
值 点 .通常 选取 几 个 不 同 的 初 值 进 行 迭 代 , 然 后 在 诸 估计 间 加 以 选择 ,以 减少 
初 值 对 结果 的 影响 . 


8.2 MCMC 方法 


上 一 节 介绍 的 EM 算法 得 到 的 是 后 验 分 布 的 众 数 (或 MLE) ,有 时 我 们 希 
望 得 到 后 验 分 布 的 一 些 其 他 特征 ,比如 后 验 均值 后 验方 差 、 后 验 分 位 数 等 . 计 
算 这 些 后 验 量 都 可 归结 为 关于 后 验 分 布 的 积分 计算 . 具体 地 , 设 rla) 为 后 验 
分 布 ,我 们 要 计算 的 后 验 量 可 写成 某 函 数 放 x) 关于 (x) 的 期 望 


Ef = | Ga) (a) ax. (8.2.1) 


对 于 较 简 单 的 后 验 分 布 ,我 们 可 以 直接 计算 (8.2. 1) 或 利用 数值 积分 等 近似 
方法 进行 计算 .但 当 后 验 分 布 很 复杂 时 ,这 些 方法 都 很 难 实施 ,特别 是 在 实际 
中 ,观测 后 验 分 布 往往 是 复杂 的 、 高 维 的 、 非 标准 形式 的 分 布 ,而 Markov Chain 
Monte Carlo( MCMC) 方 法 就 是 最 近 发 展 起 来 的 解决 此 类 问题 的 行 之 有 效 的 方 
法 .尽管 在 统计 物理 学 中 得 到 广泛 应 用 已 有 40 多 年 历史 ,但 它 在 Bayes 统计 、 
显著 性 检验 , 极 大 似 然 估计 等 方面 的 应 用 却 是 近 十 年 来 的 事情 . 

MCMC 方法 的 基本 思想 是 通过 建立 一 个 平稳 分 布 为 r(x) 的 Markov 链 
来 得 到 一 个 样本 ,基于 此 样本 进行 各 种 统计 推断 . 例如 ,车 要 估计 ES, 若 
7(x) 是 比较 简单 的 分 布 ,我 们 可 以 通过 静态 的 Monte Carlo 方法 产生 独立 的 
随机 样本 ,应 用 大 数 定律 就 可 估计 出 来 . 如 果 r(x*) 是 比较 复杂 的 分 布 ,就 从 
具有 平稳 分 布 7(x) 的 Markov 链 中 产生 样本 X, ,X,,… ,X,, 则 由 遍历 性 定理 
可 得 到 Ef 的 估计 为 


E= PAX). 
因为 Markov 链 经 过 一 段 时 间 后 才 比 较 稳定 ,所 以 在 估计 时 将 前 m 个 迭代 值 去 
掉 , 而 用 后 面 的 n - m 个 迭代 结果 来 估计 , 即 
一 1 i 
E,f= m > (X). 


从 模拟 的 角度 看 ,我 们 构造 的 转移 核 使 已 知 的 概率 分 布 r(x) 为 平稳 分 布 . 因 
此 ,在 采用 MCMC 方法 时 ,转移 核 的 构造 具有 至 关 重 要 的 作用 ,不 同 的 MCMC 
方法 ,如 Gibbs 抽样 法 、Metropolis 方法 等 ,往往 也 只 是 转移 核 的 构造 不 同 . 这 
将 在 后 面具 体 介 绍 . 
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现在 我 们 把 MCMC 方法 概括 为 如 下 三 步 ， | 

(1) 在 状态 空间 8S 上 构造 一 个 具有 转移 核 为 p( ;) 的 Makov 链 ,使 其 平稳 
分 布 为 (s). 

(2) 由 SS 中 某 点 x。 出 发 ,用 (1) 中 的 Markov 链 产生 点 列 X, OD CF 

(3) 对 某 个 m 和 大 的 n, 任 一 函数 f(x) 的 期 望 估 计 如 下 


EF =z BSA. 


在 做 模拟 时 条 件 分 布 起 很 大 作用 ,下 面 我 们 考虑 MCMC 方法 的 应 用 条 件 
Pasa) a= [xj < il, WA 
TCE) = m Ca |20) m Caa mn) sm ) = rs). 
(8.2.2) 
如 果 (8.2.2) 中 的 每 一 个 r(x |x.) 都 容易 抽样 就 只 需 用 前 面 的 方法 
而 不 需 用 MCMC 方法 . 但 在 实际 中 很 难 做 到 这 点 ,因此 需要 动态 模拟 . 此 时 
满 条 件 分 布 扮演 一 个 重要 角色 . 
L 满 条 件 分 布 
记 N = 11,2,… n]. X TCN, W= {xi,i eT} ,Xr = {xi g T}. #K 
z(xr | x_r) 为 满 条 件 分 布 .也 就 是 ,所 有 的 变量 全 部 出 现在 条 件 分 布 中 . 我 们 
注意 到 


"d 


Tr (x) 


T(xr |x_r) = x T(x). (8.2.3) 


fr (x) 48, 
Ea, es, H x, =x'_,, M 
m(sr|2z!',) m(x’) 
m(x;|x_,) m(x) 
在 (8.2.3) 和 (8.2.4) 中 去 掉 了 一 些 正 则 化 常数 ,这些 常数 一 般 很 难 计算 出 
来 ,这 也 是 MCMC 方法 的 一 个 方便 之 处 . 
【 例 8.3】 设 随 机 变量 (X,Y) 的 联合 密度 函数 为 


T(%,y) = 本 TY -yy 





(8.2.4) 


其 中 ,x =0,1,…,m,0 < ysl. 
易 知 满 条 件 分 布 为 
m(*z|y)= B(n,y), 
以 及 


m(y|x)=Beta(x + 1,n -x+2)， 
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其 中 Beta(x;a,b) 分 布 的 密度 函数 为 


T(a +b) ai _ yt" 
rlar Q =a)". 


设 y 为 观测 数据 , x = (9,8,z), 其 中 9,p,z 分 别 表 示人 参数 、 超 参数 和 缺失 数 
据 . 则 z(x) 可 写 为 mr(z| y), 
T(x|y) < p(y,z]0)z(0|e)zr(@), 
其 中 pP(y,z|69) 表示 完全 数据 的 密度 函数 , r(9 | e) 表示 先 验 分 布 , mle) 为 
超 参 数 的 分 布 . 由 (8.2.11), 各 变量 的 满 条 件 分 布 可 给 出 如 下 : 
T(b|10,p,z,) ply,z10)7(0,|0..,9), 
T(@,|0,ə@_,z,y) < z(0|e)m(e@), 
mhz |0,@,z...y) < p(y,z]0), 
其 中 9.; = 10;:j iloja 类 似 定 义 . 
【 例 8.4】 设 观 测 变量 了 Y = (Y,,Y,,…,Y,) 具有 如 下 分 布 : 


p(x;a,b) = 


ge~’ 
z(y |k,0,A)= Tm ¿=1,2,- ,天 ， 


À 


Jie 
Tr(7i |k,0,A)= ， 
y;! 


再 假定 各 参数 的 先 验 分 布 为 
z(0|b,)= Gamma(0.5,b,), 
m(A |b,)= Gamma(0.5,b,) , 
m(b,)=IG(0,1), 
m(b,)=IG(0,1), 
m(k)= Uniform(1,2,.…,n), 
其 中 ,0,A 条 件 独 立 , b,b, 独立 ,以 及 


Gammal( ag,B)= 





i=k+l,k+2,..,n. 


1 a-l -三 

< e 8 
T(o)B 
e 


T (a) » 





IG(a,B)= 
Uniform(1,2,-- n) :PIX =j} = 二 = 1,2，a 
其 中 a 称 为 形状 (shape) 参 数 , 8 称 为 刻度 (scale) 参 数 , 易 知 后 验 分 布 为 
mT(k,0,A,b,b, | Y)= IT | k.A) TI z(y, |k,0,A) 
x nC0| bn b) nb nb) nh) 
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k Y. -8 n" Y. -A 
= 8'e À 'e 1 -0.5 -E 
- II yr dl Y! ČT5 °" 


i=k+1 


1 
1 -0.5 -和 eheh 


* F0. 576,7 
各 参数 的 满 条 件 分 布 为 
m(O|k,à,b,, b, Y) < 








k Grie™? 1 geset 
nI Y! T(0.5)b,” 





< PAREN -0( kt) 


< 


n AY -À 1 _ a 
T(A |k,0,b,,b,, Y) II AOO os -È 
i=k+1 i. 


b 
= Gammal —— — ) ， 
X ros, 二 有 六 + 


n n 


A ie" AYie™* 
Tk| 0,A,b,b,,Y) o II Y. II Y,! 
i=ktl “it iske tib 








k a 
ce oÈ DRA Yie -#0-(n-k)A 


mhb, |k,0,A.,b,,Y) < 





. e 
m(b,|k,0,ÀA,b,,Y) oc b, 1 +À 


s = b, te < Ic( 9 5 ,一 一 ) . 


2. Gibbs 抽样 

现在 介绍 MCMC 方法 中 的 Gibbs 抽样 , 它 是 由 S. Geman 和 D. Geman 在 
1984 年 提出 的 ,主要 解决 高 维 随机 变量 的 模拟 ,其 具体 内 容 如 下 : 

HX = (X, XXn) 的 密度 函数 为 (x), 对 任意 指定 的 了 C N, 在 给 
定 X_, = x_, 的 条 件 下 ， 定义 如 下 随机 变量 : 

X = (XK) X=, 
而 X,' ,具有 密度 画 数 了 (sr la), MAE TWA B, 
P{X' e B} = f r(x) ms | x_p) dx’ = f mx’) de = 7(B). 


由 此 知 , X' 的 密度 函数 与 达 的 密度 函数 相同 ,也 是 rla). 
此 过 程 定义 了 一 个 由 了 到 X' 的 转移 核 , 且 其 相应 的 平稳 分 布 为 r. 这 样 
构造 的 MCMC 方法 称 为 Gibbs 抽样 (Gibbs sampler). 当 了 只 含 一 个 元 素 时 称 
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为 单元 素 Gibbs 抽样 (single-site Gibbs sampler). # T = | 计 ，, 单 元素 Gibbs 抽样 
是 在 给 定 MX1 SN Ni A 下 ; H x, 关于 (x, yo KN ,Xn ) 的 满 条 
件 分 布 抽样 ,因为 它 只 涉及 单 变量 抽样 ,非常 方便 ,从 而 使 之 极 具 吸引 力 . 

我 们 假设 X 具 有 密度 函数 r(x), 对 站 进行 Gibbs 抽样 的 步骤 如 下 : 

首先 给 出 初始 点 xz = (a0 ,x ,… ,x ). 假定 第 1 次 迭代 开始 时 的 信 
HAA O, 则 第 上 次 选 代 又 分 为 如 下 步 : 

(1) 由 满 条 件 分 布 mla |x) a... TO) HHR z, 


(i) 由 满 条 件 分 布 zx; aP ai shi osa ) 抽取 

(n) 由 满 条 件 分 布 7(x, | xi xi) AR 
ix) = (aP eea), M 0... 7 t ,.... 为 n 维 Markov 链 的 实现 .其 由 x 到 
x' 的 转移 概率 函数 为 

p(x,x') = m(x | za xn)TT(Xa EAEE IEE O ELEA EAEE DE 
易 知 m(x) 为 此 Markov 链 的 平稳 分 布 . 

上 述 得 到 了 一 个 Gibbs 抽样 序列 ,那么 这 样 得 到 的 Gibbs 抽样 序列 是 否 收 
Aku? 至 今 还 没有 一 个 简单 而 有 效 的 方法 来 判断 . 在 实际 中 ,通常 采用 以 下 两 
种 直观 的 方法 来 判断 . 

方法 一 是 用 Gibbs 抽样 产生 多 个 Markov 链 , 在 经 过 一 段 时 间 后 ,如 果 这 
几 条 链 稳定 下 来 , 则 表明 Gibbs 抽样 收敛 . 

方法 二 是 每 隔 一 段 时 间 取 一 个 样本 计算 其 平均 值 . 当 这 样 算得 的 均值 稳 
定 后 ,就 可 认为 此 Gibbs 抽样 收敛 . 

【 例 8.5】 设 观 测 变 量 了 ,7,,… ,了 , 独 立 且 服从 N(u,o2), (wo ) 的 先 


验 分 布 为 了 (ua2) < = & Y= (Y,,Y,,-- Y.) ;了 的 观测 值 为 >( 表 8-1) , 估 


H E(u |Y=y) ME |Y = y). 


3 8-1 观测 值 ? 


0 
1.749 -0. 085 0. 802 1. 182 0. 617 1. 023 0. 528 0. 502 1. 242 0. 929 1. 820 2. 148 0. 677 1. 220 
0. 061 0. 732 0. 149 1. 604 0. 917 1. 041 0. 024 1. 712 1.241 1. 573 1. 080 0. 962 1.061 2.012 
1.612 0. 535 1. 087 0. 658 1. 279 0. 934 1. 068 1. 368 0. 549 1. 105 0. 621 1. 857 0. 698 0. 872 
0. 069 0. 725 0. 865 1. 179 1.381 2. 230 0. 616 1. 282 


首先 计算 (a.c?) fE Y = y 的 条 件 下 的 后 验 分 布 : 
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T+ ( í )° 
(a, |Y=y) < (2) al 2 "A f 
m= 2 
2o 


则 易 知 (uo) 的 满 条 件 分 布 为 


mlu lo ,7y) cc “| > (y =u) | < a(z, Z) ， 
20° 


20 
我 们 根据 上 述 满 条 件 ,编写 R 程序 如 下 : 


exam8. 5 =function(y,n,a,b) | 


=+1 - 一 2 n 2 2 
n(o? |u, y) < (5) af - 之 (y; u) | < y - u) ) 


th=matrix(0,ncol=2,nrow=n) 
m=length(y) 
th[1,]=c(a,b) 
for(i in 2.n)| 
th[i,1] =rnorm(1,mean(y),sqrt(th[i-1,2]Zm)) 
th[i,2] =1/rgamma(1,m/2,sum((y-th[i,1])2)/2) 
} 
list(mu=th[ ,1] ,sig2=th[ ,2]) 
l 
给 定 (a.c?) 的 初始 值 为 (a,5) ,运行 exam8.5(y,5000 ,1,0.25) 得 到 Markov 
链 的 一 个 实现 ,如 图 8-1, 得 到 jw,o? 的 MCMC 的 估计 为 应 =1.0,6? =0.31. 而 
> (y; 一 y)° 
no 的 理论 值 E(u | y) = 元 = 1.0, E( o? |y)=— =0.31. 说 明 模 拟 
效果 非常 好 . 
【 例 8.6】 设 X,i=1,2,3,4,5, 是 相互 独立 的 指数 随机 变量 ,日 ,有 均 
È i, 试用 模拟 来 估计 


p=P{ Iz, > 120 | Zx =15}. 


首先 ,假设 X 和 了 Y 是 独立 的 分 别 具 有 速率 A M u 的 指数 随机 变量 ,其 中 
H <A. ERE X +Y = a 的 条 件 下 针 的 条 件 分 布 如 下 : 
fx |z. (x | a) =Cfx,y(z,a —x) (O < x <a) 
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8-1 六 和 的 模拟 图 


=C,e ee 
三 CA 
上 式 表明 X 的 条 件 分 布 是 速率 为 A- 的 指数 分 布 , 此 处 x < a. 下 面 给 出 模 
拟 B 的 步骤 : 


5 
Step 1: 令 初始 状态 为 zo = (10 aO ,ao a am) mm > 0 B Ya. = 
i=l 
15. 
Step 2: 从 集合 1,2,3,4,5 中 随机 地 选择 两 个 元 素 1 和 J, 且 7 < J, $ X, 
和 X, 看 做 变量 , 记 S =X, + X; 


Step 3: 在 给 定 条 件 S=X,+X,=15- > z 下 ,从 参数 为 于 - — 的 指 


1 天 了 天 了 


数 分 布 中 抽取 随机 变量 于, H X, = X,X, = S — X, 更 新 x, 中 对 应 位 置 的 值 ,其 
他 位 置 的 值 保 持 不 变 , 从 而 得 到 x. 
Step 4: 重 复 Step 2 和 Step 3 得 到 序列 zu ,zi ，… 


Step 5: 计 算 状 态 序列 xs,zi,… 满足 [] x; > 120 的 比例 , 即 为 B 的 估计 . 
其 R 程序 为 


exam8. 6 = function(n,x0,d) Í 
k=0 
X=matrix(0,nrow=n,ncol=5) 
X[1,]=x0 
for(i in 1;(n-1)){ 
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I=sample(1:5,2) 
I=sort( 1I) 
X[i+1,]=X[i,] 
X[i+1,I[1]]=rexp(1,1/1[1]-1/1[2]) 
X[i+1,1[2]]=X[i,1[1]]+X[i,I[2]]-X[i+1,I[1]] 

! 

for(j in 1:n)! 
if( prod( X[j,])>d)k=k+1 

} 

k/n 

| 
运行 exam8. 6(10000,1:5,120) 得 到 估计 为 6 = 0. 1391. 
3. Metropolis-Hastings 方法 


上 节 介 绍 了 Gibbs 抽样 方法 ,本 节 将 介绍 比 Gibbs 抽样 方法 出 现 更 早 、 也 更 
一 般 的 MCMC 方法 ,也 就 是 Metropolis-Hastings 方法 . Metropolis 等 人 在 1953 年 
提出 了 一 种 构造 转移 核 的 方法 , Hastings 随后 对 之 进行 推广 ,形成 Metropolis- 
Hastings 算法 ,其 主要 思想 如 下 : 

任意 选择 一 个 不 可 约 具 有 转移 概率 9(.，.) 的 Markov 链 {Y,,t > 0] ,以 
及 一 个 函数 a(.,*),0 < a(.,.) <1, 对 任意 的 状态 (x,x') (ax), 定义 

p(x,X’)= q(x,xz')a(x,xz'), Xx". (8.2.5) 

则 p(x,x') 形成 一 个 转移 核 . 记 具 有 转移 核 p(x,x') 的 Markov 链 为 |X,,t > 
01. 

(8.2.5) 表明 如 果 链 在 时 刻 :的 状态 为 ,=x, 则 首先 由 4(. | x) 产生 一 
个 潜在 的 转移 x 一 x', 然后 根据 概率 a(x,x') 决定 是 否 转移 . 也 就 是 说 ,在 潜 
在 转移 点 x' 找到 后 ,以 概率 a(x,x') 接受 *' 作为 链 在 下 一 状态 值 ,而 以 概率 
1 -a(x,x') 拒绝 转移 到 x', 从 而 链 在 下 一 时 刻 仍 处 于 状态 x. 于 是 ,在 有 了 x 
后 ,我们 可 从 (0,1) 上 的 均匀 分 布 抽 一 个 随机 数 u, 则 

X = 人 = a(x,x'), 
x,u > a(x,x'). 

一 般 , 分 布 g(. | z) 称 为 建议 分 布 (proposal distribution). 

因为 我 们 的 目标 是 使 后 验 分 布 r(x) 成 为 Markov $ |X, > 0| 的 平稳 
分 布 . 故 在 有 了 9('，') 后 ,应 选择 一 个 a(:,.) 使 相应 的 p(x,x’) DL r(x) 
为 其 平稳 分 布 .通常 的 选择 是 

204 


— 一: 第 8 章 EM 算法 和 MCMC 方 法 和 -一 一 





x.x') = min T(x')q(x',x) 
a(x,z') = m 人 (8. 2. 6) 
此 时 ,有 
q(x,x'), m(x')q(x',x) Z zr(x)q(x,x'), 
(x,x') = , 
PAEA IE glare) ZED, alaala) < m(x)q(x,x'). 
m(x) 


(8.2.7) 
具有 转移 核 (8.2.7) 的 Markov 链 有 如 下 性 质 . 
性 质 8.1 具有 转移 核 (8.2.7) 的 Markov 链 是 可 逆 的 , 即 
m(x)p(x,x')=2+(xw')p(x',x), (8.2.8) 
H r(x) 是 由 (8.2.7) 确定 的 Markov 链 的 平稳 分 布 . 
证 x= x, 则 式 (8.2.8) PARI. Bx x, A 
Te) ge 
”T(x)g(x,x’) 
=min[|7(x)q(x,x'),2m(x')q(x',z)1 
m(x')q(w%',x) 
maD a) 


m(x)p(x,x')= s(x)q(w*,z')min[1 


= (xz )g(x ,z)min[ 


= m(x')}p(x',x). 
故 (8.2.8) 成 立 .对 (8.2.8) 两 边 同 时 关于 *x 积分 ,有 


[rx)ps,x') ds = fC) pla' a) ds = mr(%') [p(x’ z) de =z(x'). 


假设 1X,,t > 0] 为 可 道 的 不 可 约 Markov 链 ,其 状态 空间 为 S = {1,2,…， 
m] , 其 平稳 分 布 为 7+(x). 下 面 给 出 产生 此 链 的 Metropolis-Hastings 算法 : 

Step 1: 选择 一 个 不 可 约 Markov 链 转 移 概率 q(i,j) ,ij e S. 再 从 3S= |1， 
2,…,m) 中 选择 某 个 整数 于 

Step 2: n = 0 UK X, = k. 

Step 3 :产生 一 个 随机 变量 下 使 得 已 和 = 由 =q(X,,j) , 再 产生 一 个 随机 数 


z(X)q(X,X,) 
m (XJ, X)” 

Step 5: n 4—n + 1,X, = MH. 

Step 6: 返 回 Step 3. 

由 上 述 性 质 可 以 看 出 ,建议 分 布 a(x,x') 可 以 取 各 种 形式 .下面 我 们 介绍 
一 些 常 用 的 建议 分 布 的 选择 方法 . 

( i ) Metropolis 选择 


Step 4; 如 果 U < MJ MH = 处 ;否则 MH = X,. 
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选择 对 称 的 建议 分 布 , 即 
q(x,zs')=q(x',x), Vx,x’ e€ S. 
此 时 ,有 
alx,x') = min| 1 z9), 


m(x) 


例如 , 若 要 产生 一 个 平稳 分 布 为 z (z) = exp{ - Z) 的 Markov 链 ,我 们 可 以 


取 建议 分 布 为 q(x,x') ee exp{ - CAS), 再 利用 上 述 算法 即 可 实现 . 


(让) 独立 抽样 
WMR q(x,%') 与 当前 状态 x 无 关 , 即 g(x,x') =g(x'), 则 由 建议 分 布 导出 
的 Metropolis-Hastings 算法 称 为 独立 抽样 . 此 处 alx, x) 变 为 


aļ(x,x') = min{1 ,7 ， 


_ T(x) 
其 中 w(x) = g(x) 


一 般 独 立 抽样 的 效果 可 能 很 好 也 可 能 不 好 ,通常 要 使 独立 抽样 有 好 的 效 
R, g(x) 要 接近 (x) ,比较 安全 的 办 法 是 使 g(x) 的 尾 比 r(x) 重 . 

( ii ) 单 元 素 Metropolis-Hastings 算法 

同时 产生 整个 向 量 X, 有 时 是 很 困难 的 ,而 对 外 的 分 量 逐 步 进行 抽样 , 则 
简单 得 多 . 这 就 要 用 到 条 件 分 布 ,特别 是 满 条 件 分 布 . 

考虑 X, | Xi,i = 1,2,…,n 的 条 件 分 布 , 选择 一 个 转移 核 q(x, — 
alaa), BDE X.” = X. sa WE, qx, a |x) 产生 一 个 可 能 的 x,'， 
然后 以 概率 








m(x')q,(x,' — x, | “| 
"7(x)g(x— x |x) 
决定 是 否 接受 x' 作为 链 的 下 一 个 状态 . 这 就 是 单元 素 Metropolis-Hastings 算 
法 . 

Gibbs 抽样 是 一 种 单元 素 Metropolis-Hastings 算法 , 它 是 在 Metropolis-Has- 
tings 算法 中 取 g(x’ 一 x) 为 T(xi|x.;) , 易 知 ,此 时 a(x’ 一 x)=1. 

在 Gibbs 抽样 中 , m(x; |x) 可 能 难以 抽取 ,而 Metropolis-Hastings 算法 有 
很 大 的 灵活 性 , 它 可 取 CO, ) 为 易于 抽取 的 分 布 . 在 实际 中 ,我 们 应 将 它们 
结合 起 来 使 用 . 

【 例 8.7】 在 例 8.4 中 ,假设 了 的 观测 数据 如 表 8-2 所 示 . 


a(x; 一 2 | x)= min| 1 
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表 8-2 观测 数据 
35934555513182784108 3 12 10 10 3 9 8 





5 9 4 6 1 5 i47 9 10 8 13 8 11 11 10 11 13 10 3 8 5 





试 估计 6,A ,k,b1,5b, 的 后 验 均值 . 

由 于 在 例 8.4 中 已 经 得 到 了 各 参数 9, 和 A ,k,5, ,6b, 的 满 条 件 分 布 , 现 从 中 
抽样 得 到 长 度 为 n 的 Markov 链 . Metropolis-Hastings 算法 : 

Step 1: 选 一 个 Markov 链 的 初始 值 (0° ,A ,已 , 玉 ,六 ) = (1,1,12,1,1). 

Step 2:4% i + 1 步 更 新 ,假设 第 i 步 值 为 (90,A',k bib), 则 利用 Gibbs 
如 下 抽样 : 


b: 

0 ~ m0 |A’, k, bi bi Y) = Gamma > Y, + 0.5 aT): 
| 1 > "jib +1 

A ~ 7(A 0 Kb, bY) = Gamma[ Sya 0.5.) , 
| ' > i kb +1 


b ~ nb 0, Aik’ ,bi Y) = tG[0.s,— =) ， 
1+0 


b! ~ mlb, |0 As sh, bit Y) =16(0. 5 ,一 一] 
'1 +A 


由 于 上 的 满 条 件 分 布 不 是 标准 分 布 , 利 用 Metropolis-Hastings 算法 抽取 : 
kit! ~ m(k| 0'* +1 A sb bin), 


BEIM qK k) = U(23,-—-,m - 1)， 严 为 了 的 个 数 , 即 q(jt) = 二 二 
则 





, i+1 i+1 i+l i+l 
a(k ,k') = minf ZSE 18 sA" obi obz Y) 1}. 


mhk |@*' A b ,br Y)? 
从 (2,3,…,m — 1) 中 任意 抽取 一 个 ,产生 一 个 随机 数 4, 若 u < e (k'.k'), 
Mk =k, mM), k! = Kr 这样 就 得 到 第 i+ 1 个 更 新 (0. A U ,bi ， 
by). 
重复 上 述 步骤 即 可 得 到 此 Markov 链 的 m 个 实现 值 . 其 R 程序 如 下 : 
mhsampler = function ( NUMIT = 1000 ,dat=Y) I 
n = length( dat) 
mchain = matrix( NA, 5, NUMIT) 
kinit = floor( n/2) # approximately halfway between 1 and n 
mchain[ ,1] = e(1,1,kinit,1,1) 
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for (iin2:NUMIT) 
Í 
currtheta = mchain[ 1 ,i—-1] 
currlambda= mchain[ 2 ,i-1] 
currk = mchain[ 3 ,i-1] 
currbl = mchain[4,i-1] 
currb2 = mchain[5,i-1] 
## sample from full conditional distribution of theta ( Cibbs update) 
currtheta = rgamma( 1 ,shape=sum( Y[1 :currk ] ) +0.5 ， 
scale = currbl/ (currk * currbl +1) ) 
## sample from full conditional distribution of lambda ( Gibbs up- 
date) 
currlambda = rgamma( 1 , shape = sum ( Y [ ( currk+1 ):n])+ 
0.5, 
scale = currb2/ ( ( n—currk) * currb2+1 ) ) 
## sample from full conditional distribution of k ( Metropolis- 
Hastings update) 
propk = sample(x=seq(2,n-1), size=1) # draw one sam- 
ple at random from uniform(2,.. (n-1)) 
## Metropolis accept-reject step (in log scale) 
logMHratio = sum(Y[1:propk]) * log( currtheta ) +sum ( Y 
[ ( propk+1):n]) * 
log( currlambda ) -propk * currtheta— ( n-propk) * currlambda 
—(sum(Y[1:currk ]) * log(currtheta )+sum( Y[ (currk+1) ;n]) * 
log( currlambda) -currk * currtheta- ( n—currk) * currlambda ) 
logalpha = min(0 ,logMHratio) # alpha = min(1,MHratio) 
if (log( runif(1))<logalpha) 
I 
currk = propk 
| 
currk = currk # if we do not sample k (k fixed) 
## sample from full conditional distribution of b1 ( Gibbs update) ; 
draw from Inverse Gamma 


currbl = 1/rgamma( 1 ,shape=0.5, scale = 1/( currtheta+1 ) ) 
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## sample from full conditional distribution of b2 ( Gibbs update): 
draw from Inverse Gamma 
currb2 = 1/rgamma( 1 ,shape=0.5, scale=1⁄/(currlambda+1 )) 
## update chain with new values 
mchain[ ,i] = c(currtheta , currlambda ,currk ,currbl , currb2 ) 
l 
return ( mchain ) 
! 
运行 apply( hsampler( ) ,1 ,mean) 得 到 6,A ,k,b, b, 的 后 验 均 值 的 估计 分 别 为 
4.90,8.93,8.53,21031.95, 21935.82. 


8.3 模拟 退火 


模拟 退火 ( Simulated Annealing,SA) 法 最 早 由 N. Metropolis 等 人 于 1953 
年 提出 ,但 在 当时 没有 受到 重视 ,直到 1983 年 由 S. Kirkpatrick , C. D. Gelatt 和 
M. P. Vecchi 提出 Monte Carlo 模拟 概念 的 随机 搜寻 技巧 ,利用 此 方法 来 求解 
最 优化 问题 时 才 受 到 重视 . 

模拟 退火 来 自 冶金 学 的 专 有 和 名词“ 退火 ”。 退 火 是 将 材料 加 热 后 再 经 特 
定 速率 冷却 ,目的 是 增 大 晶 粒 的 体积 ,并 且 减 少 晶 格 中 的 缺陷 。 材 料 中 的 原子 
原来 会 停留 在 使 内 能 有 局 部 最 小 值 的 位 置 ,加 热 使 能 量变 大 ,原子 会 离开 原来 
位 置 ,而 随机 在 其 他 位 置 中 移动 。 退火 冷却 时 速度 较 慢 ,使 得 原子 有 较 多 可 能 
可 以 找到 内 能 比 原先 更 低 的 位 置 。 

模拟 退火 的 原理 也 和 人 金属 退火 的 原理 近似 :我 们 将 热力 学 的 理论 套用 到 
统计 学 上 ,将 搜寻 空间 内 每 一 点 想象 成 空气 内 的 分 子 ; 分 子 的 能 量 ,就 是 它 本 
身 的 动能 ;而 搜寻 空间 内 的 每 一 点 ,也 像 空气 分 子 一 样 带 有 "能 量 “ , 以 表示 该 
点 对 命题 的 合适 程度 。 算 法 先 以 搜寻 空间 内 一 个 任意 点 作 起 始 : 每 一 步 先 选 
择 一 个 “邻居 ” ,然后 再 计算 从 现 有 位 置 到 达 “ 邻 居 " 的 概率 。 

令 S=1s, ,9 ,8 ,其 中 s; 为 向 量 ,并 令 V(x) 是 非 负 的 函数 , x e S, 假 
it Vx) 在 $S 上 至 少 有 一 极 小 值 点 , 即 

V" = minV(x) ， 
且 
M= {x e S:V(x)=V*}. 

我 们 的 目的 是 求 出 7 ,以 及 在 M 中 的 一 个 元 素 . 为 实现 此 目的 ,我 们 试图 用 
Metropolis-Hastings 算法 . 
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首先 , 令 温 度 参数 7 > 0, 并 考虑 下 述 概 率 函数 : 


e 
pr(x) =—— x xe S. 
了 
xes 


S | M| 表示 MM 中 元 素 的 个 数 .用 ef 乘 以 上 式 的 分 子 和 分 母 得 到 


V(z)- V * 
一 T 





Pr(x) = ° Vx) -yt 
| M| + > e H 


x M 


因为 V(x) -V° > 0, 故 当 7 一 0 时 ,我 们 有 


1 + 
Tur #r<xeM, 
pr(x) — | M| 


0, # x g M. 
其 次 ,如 果 我 们 令 了 足够 小 ,并 产生 一 个 其 极限 分 布 为 Pr(z) 的 Markov 链 , 则 
极限 分 布 的 绝 大 多 数 将 集中 在 M 中 的 点 上 . 如 何 产生 极限 分 布 为 m (xz) 的 
Markov EW? 先 假设 当前 状态 为 向 量 x e S, 随机 选择 其 任 一 相 邻 向 量 y < S 
将 作为 下 一 状态 . 所 谓 相 邻 向 量 , 指 两 个 向 量 仅仅 在 一 个 坐标 上 不 同 ,或 者 一 
个 能 够 通过 交换 另 一 个 的 两 个 分 量 而 得 到 . 然后 用 Metropolis-Hastings 算法 ， 
下 一 个 状态 以 如 下 概率 接受 》: 


V(O) 
T 


| [IN(y) | 
minyl,— Ye) 
—e " _ 
| N(x) | 


否则 ,保持 x 不 变 ,其 中 |NO) | 是 y 的 “邻居 ”的 个 数 . 

如 果 每 个 向 量 有 相同 的 邻居 数 ,即使 邻居 数 不 同 ,我 们 也 可 通过 增加 状态 
空间 并 令 新 状态 的 了 值 等 于 0 来 使 其 相同 ,那么 当当 前 状态 是 x 时 ,其 邻居 中 
的 一 个 了 被 随机 地 选择 到 时 , 若 V(y) < V(x) , 则 此 链 一 定 转移 到 状态 y ; 若 


V(y) > V(x), 则 此 链 以 概率 epf Z0 — VO] 转移 到 状态 y, 或 者 保持 在 


状态 x 不 变 . 

上 述 算法 的 一 个 弱点 是 因为 了 被 选择 得 足够 小 ,如 果 此 链 进 人 到 状态 x, 
它 的 了 值 比 其 邻居 中 的 每 一 个 都 小 ,那么 此 链 进 入 到 其 他 状态 可 能 需要 花 很 
长 时 间 . 第 二 个 弱点 是 因为 只 有 有 限 个 zx 的 可 能 值 ,整个 收敛 概念 似乎 是 没有 
意义 的 ,因为 在 理论 上 我 们 能 够 计算 每 个 可 能 值 ,所 以 经 过 有 限 步 可 以 得 到 其 
收敛 值 . 因此 ,不 从 严格 的 数学 观点 来 考虑 上 述 方法 ,从 理性 上 把 它 作 为 一 个 
启发 式 的 方法 ,这 样 做 发 现 允许 7 的 值 随 着 时 间 的 变化 而 变化 是 有 用 的 . 
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因此 对 上 述 方法 的 改进 就 是 所 谓 的 模拟 退火 算法 . 其 思想 如 下 : 设 T., 
n 之 1 是 一 个 指定 的 其 值 单 调 下 降温 度 序列 . 如 果 这 个 Markov 链 的 第 n 个 状 
SEx, 现 随机 地 选择 一 个 其 相 邻 值 y, 则 下 一 个 状态 或 者 以 下 述 概率 为 : 


YQ) 
e T, 


™ x y 
e Ta 
| N(x) |! 


2 C _ 
logii +n)’ 


或 者 停留 在 x. 


基于 数学 上 收敛 性 的 考虑 , 取 工 , 其 中 C > 0 是 任何 固定 的 


正常 数 (参见 Besag et al. ,1995 ;Diaconis and Holmes ,1995 ). 如 果 我 们 相继 产 
ET mIRE X Xa Xn RE RIEBE min VO) 来 估计 六 ,又 
如 果 在 了 ”上 有 最 小 值 , 这 就 是 在 M 中 的 要 估计 的 点 . 

[818.8] (旅行 商 问题 ) 假 设 有 mm 个 城市 cy ,cs,… ,cn, 以 及 一 个 mxm 
对 称 和 矩阵 D = (dj) , 其 元 素 d, 表示 城市 i 和 城市 j 的 距离 . 又 假设 一 个 商人 居 
住 在 某 个 城市 c, 中 ,他 需要 到 其 他 的 m -1 个 城市 中 推销 商品 ,然后 返回 家 
乡 . 则 他 应 该 以 何 种 顺序 游历 这 些 城市 ,使 其 路 程 最 短 ? 


令 


fx) = Ý dla) + dlan), 
JEP x A eiea, sen 任意 一 个 排列 . 在 本 例 中 , x 的 邻居 是 由 互 换 x 中 任意 
两 个 分 量 而 得 到 ,共有 C = (m — 个 邻居 .得 到 Markov 链 的 转移 概率 为 


ioa, O aaam, 
P... = lo. 若 x 与 x' 不 为 邻居 ， 


1 


算法 为 
Step 1;: 令 和 = (c, ,c,, "e, ) 为 初始 状态 . 
Step 2: X, = (xz alh ea) 为 第 n 个 状态 .从 1,2,…,m 任 取 
1,] 且 7 < J], RENK X, 中 的 第 7 和 第 J 个 分 量 ,得 到 


(n) ... (n) (n) (a) ... (n) (n) (a) ... (n) 
Y = (x,a SX Np TN Nj 第 ). 


Step 3: 产 生 一 个 随机 数 , ESO) SAX), WS X, =Y ;否则 ,以 概率 
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X) -f 、 X.) -fO 
“p(y ) ë X.. = Y, 或 者 以 概率 1 - exp 人 (人 和 使 
下 = X,. 

Step 4: 计 算 min | f(X.) ,n > 11, fü yE lh X. 
其 R 程序 为 

exam8.8=function(m,D) {#m 为 产生 的 Markov 链 的 长 度 ,D 为 初始 
距离 矩阵 
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k=length(D[ ,1]);d=0 
x=matrix(0 ,nrow =m,ncol=k) #Markov 链 的 各 时 刻 的 状态 
x[1,]=1:k 
for(j in 1:(k-l))1! 
d=d+D[j,j+1] 
l 
d[1]=d+D[k,1] 
for(i in 2:m) |] 
E=sample(1:k,2) 
I=F[1];J=E[2] 
C=D 
x[i,]=x[i-1,] 
x[i,J] =x[i-1,I];x[i,!1]=x[i-1,J] 
a=D[,1];D[,1]=D[,J];D[,J] =a 
b=D[I,];D[I,]=D[J,];D[J,] =b 
di =0 
for(j in 1:(k-1))]1 
dl =d1+D[j,j+1] 
l 
d[i]=d1+D[k,1] 
if( runif(1)<=min(1,exp( (d[i-1]-d[i])/Zlog(1+i))))] 
x[i, ]=x[i,] 
} 
else | 


x[i,]=x[i-1,];D=C 
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G=0 
for(i in 1;m) {| 
if(d[i] = =min(d)) |! 
G=rbind(G,x[i,]);opd=d[i] 
po 
| 
G=G[-1,] 
list( path =x ,distance = d ,optimpath = G ,optimdistance =opd) 


| 


8.4 SIR 方法 


假设 随机 向 量 半 具有 概率 函数 所 xz) = C,f,(x) ,其 中 C, 为 一 个 正常 数 , 随 
机 向 量 了 Y 具 有 概率 函数 g(?) = C,z (y) ,其 中 C, 为 一 个 正常 数 . 在 筛选 法 中 ， 
# f(x) 和 g(y) 是 确定 的 , 且 g(y) 易 抽样 , 先 从 8(?) 中 产生 向 量 Y, 我 们 可 


选择 常数 C > 0 使 得 一 一 ,以 概率 fO) 接受 向 量 了 ;否则 重新 开始 . 
cg(y) <€ 1 Cg(y) 


这 样 就 可 产生 出 具有 平稳 概率 f(x) 的 样本 . ESE z A ERE , ERM AE 

法 不 可 行 . 对 于 此 问题 我 们 需要 SIR( Sampling Importance Resampling) 算 法 . 
SIR 方法 的 思想 :首先 相继 产生 一 个 其 极限 概率 函数 为 g 的 Markov 链 的 

m 个 状态 , 记 这 些 状态 为 y，… ,y。 然后 定义 “权重 ”w;,i =1,2,…,m, 如 下 : 











w „HOD 
EASAN 
并 产生 一 个 随机 向 量 使 得 
PIX =y} =——, j=1,2,=,m. 
Se 


M m EAA AREPA BO BAULE X EARRA f. 
命题 8.1 当 m 一 ,通过 用 SIR 315480 4 Et X 80245 Es KAA 





f 
证 令 Y,i=1,2,…,m ,表示 由 具有 极限 概率 函数 g 的 Markov 链 产生 
的 mm 个 随机 向 量 , 令 w, -EAE 表示 它们 的 权重 . 对 国定 的 向 量 集 A, < 


; -10A Y, e A, 
Lo ,否则 ， 
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从 而 


P|X e Al Y,,i=1,2,-. m} = (8.4.1) 





根据 Markov 链 的 收敛 性 定理 , 当 m — om 时 ,有 
S A ELW] = EWI I= 1]P, {= 1} = Bwiy e 4]P17 e Al, 


H 





-A _ F [A(Y)1) _ rhly) _ C, 
> m E LW] = E [ey] UPOLA 


因此 ,在 (8.4.1) 中 分 子 分母 同 时 除 以 mm 得 


. C, 
PIX e Al Y,,i = 1,2,:-- ,m] —E,[WI Y e AJP,[Y eA}. 
2 





而 
CELW Y e AlP,lY e A| = É. E [A | Y e A] PlY eA 
C, “lz 
p Dana 
=| fov. 
从 而 , 当 m 一 e 时 ， 


P|X e Al Y,,i = 1,2,:-. ,m] 一 | fly)dy, 
由 Lebesgue 控制 收敛 定理 知 , 上 式 草 涵 着 
P|Xe A] =E[P|X e A| Y.i=1,2,-- m] 1 — | Sav. 


结果 得 证 . 
车 要 估计 9 = E,[h(X)], 而 且 用 SIR 方法 已 经 得 到 向 量 X,X,X, 
ku E EAA hiii 


P| X = y, 





2? J=1,2,.…,m, 


n 


而 二 较 小 , 且 a =O. 然后 用 X CO 作为 9 的 估计 量 . 在 上 述 估计 量 
的 基础 上 ,我 们 对 其 取 条 件 期 望 
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EL[h(X) | yy," In] = $ eho). 
ss. 
故我 们 再 用 6 = 一 Y whly,) 作为 9 的 人 计量 根据 6.2 节 中 条 件 期 望 方 
3 
差 缩减 法 知 , 8 E > PO 更 好 的 一 个 估计 量 


SIR 方法 在 Bayes 统计 中 是 特别 有 用 的 . 
【 例 8.9】 用 SIR 算法 在 条 件 $ jX, > 285000 下 产生 1,2,… ,100 的 一 


个 置换 X, , X, |... Xio 的 条 件 分 布 . 
W X=(X,,X,,-: Xw) 为 1,2,: ,100 的 某 个 置换 , 令 n = 100!, 则 1， 2, 


…,100 的 所 有 的 置换 为 8 = [x ,zx 1k # = xx, > 285000} , 
M PIX = | Xx, > 285000 | 就 是 所 要 求 的 条 件 分 布 . 易 知 
P|X=x|P| Xx, > 285000 | X = | 


尽管 我 们 知道 P[x =x] Xx, > 285000 | = 


PE ==. Y X, > 285000 | = 
— 


, 





— T z e A, 但 A RRR 


定 . 所 以 我 们 要 通过 SIR 方法 对 之 进行 估计 . 令 z(z) = PIX = x] = 100T， 
x€ SA2) = P|X= | P| X, > 285000 | x=* 先 从 g(x) 中 抽取 足够 
多 的 m 个 不 同 的 排列 , 记 为 YY y)... y. B Y= (Y, Y? Yi), 


i=1,2,…,m ; 令 oa) = PÍ Y jx, > 285000 |X ==], m 
j 


(Y) = e M, 
0 ,否则 . 
(i) 
再 令 w; -2Y ) ,i- 1 2 |, m. 去 掉 Wi Wa W a 中 为 0 的 项 , 即 为 所 求 
Do Y°’) 
的 条 件 分 布 ， 
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R 程序 如 下 : 
exam8. 9 = function ( m ,k=100,a=285000) | #k 为 正 整数 
J=1:k; X=matrix(0,nrow=1,ncol=k) 
Y=matrix(0 ,nrow=my,ncol=k) 
Y[1,]=sample(1:k) 
for(i in 2.m) Í 
c=0 
repeat | 
per=sample(1:k) 
for(r in 1:(i-1))! 
c[r]=all(per==Y[r,]) 
} 
if( all( c == FALSE ) = = TRUE ) break 
l 
Y[i,]=per 
} 
for(j in 1:m) | 
ifísum(J* Y[j,])>a)] 
X=rbind(X,Y[j,]) 
l 
} 
X=X[-1,] 
w=1/(nrow(X)) 
list(n=nrow(X),w=w,X=X) 
| 


练 习 8 


1. 假设 控制 孟 德 尔 试验 中 , 吾 豆 颜色 的 位 点 有 两 个 等 位 基因 A 和 a, LR 
设 基因 型 AA 和 Aa 对 应 的 表现 型 为 黄色 ,基因 型 aa 对 应 绿色 。 现 随机 获得 
ALEE, RERA na, St 6.9 SP US nm. 根据 数据 n, = 84 和 n, = 
16, 如 何 用 EM 算法 估计 等 位 基因 A 的 概率 P = P141 ? 并 编写 程序 计算 . 

2. 利 用 Metropolis-Hastings 算法 及 其 建议 密度 


y 


q(x,y)=e”, y> 0, 
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从 折 杰 的 正 态 分 布 


fea) = /全 emp(- 0.52) x > 0 
T 


中 抽取 样本 的 程序 . 
3. 考虑 下 述 模型 : 


y; “NO,0’) ， 71=1,2,.…,n, 
其 中 
u ~ N(0,00), 
o, ~ IGamma(2,1), 
o° ~ IGamma(2,1), 
在 给 定 样本 y yy 的 条 件 下 , 试 利用 Gibbs WEI u, oo, o ,并 编 
写 程 序 . 


4. 考虑 一 个 有 20 个 独立 部 件 的 系统 , 且 部 件 i 以 概率 0.5 + a =l, 


2,… ,20, 工作 . 令 了 表示 工作 的 部 件数 . 用 模拟 来 估计 条 件 概 率 函 数 PIX = 
ilXs5},i=1,2,3,4,5. 
5. 假设 随机 变量 X 和 了 都 在 (0,10) 上 取 值 . 假设 在 给 定 了 = y 的 条 件 下 
X 的 条 件 密度 为 
f(x|y)=C(y)e?%”, 0 < x < 10, 
ERE X = x 的 条 件 下 了 的 条 件 密度 为 
fly|x)=C(x)e’™”, 0<y< 10. 
给 出 一 种 方法 来 模拟 向 量 忆 和 了 了 , 并 用 模拟 来 估计 E[X] 及 E[ XY]. 
6. 令 站,i =1,2,3, 是 独立 的 具有 均值 为 1 的 指数 随机 变量 . 产生 一 个 模 
拟 研究 来 估计 
(1) E[X, + 2X, + 3X | X, + 2X, + 3X, > 15] ; 
(2) E[ X, + 2X, + 3X, | X, + 2X, + 3X, < 1}. 
7. 从 一 个 装 有 n. i = 1,2,…,r, 种 颜色 卡片 的 卡片 盒 中 随机 地 选择 m 张 


+h. n = > n 设 表示 被 取得 的 第 i 种 颜色 的 卡片 数 . 若 所 有 的 7 种 颜 


色 的 卡片 都 被 取 到 , 且 所 有 的 颜色 都 被 取 到 的 概率 是 一 个 很 小 的 正 数 , 试 给 出 
一 个 有 效 的 程序 来 模拟 六, ,X,,… ,于 
8. 假设 X,Y,2 的 联合 密度 为 
f(x,y,z) = CeT EED x>0,y>0,z>0， 


其 中 a,b, 是 确定 的 非 负 常数 ，C 不 依赖 于 x,y,z 试 给 出 模拟 X,7,2 的 程 
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È. H a =b =c=1l 时 ,通过 模拟 来 估计 E[XYZ]. 
9. 对 随机 变量 X,Y, N, 假设 


PIX=i,y < Y= y+dy,N = nl = cf”) y*m (1 - y} "ee Aay, 
i n! 


其 中 i=0,1,… ,n,n=0,1,…,y 之 0, a,B,A 是 指定 的 常数 . 当 @ = 2,B = 3, 
À =4 时 ,通过 模拟 来 估计 E[X],E[Y] 和 E[N]. 

10. 产生 100 个 随机 数 Usk =1,2,,10,U, i Ji j= 1,2,.. 10. 考 
虑 一 个 旅行 推销 商 问题 . 此 推销 商 从 城市 0 出 发 ,按照 1,2,… ,10 的 某 个 排列 
必须 依次 到 10 个 城市 1,2,… ,10 中 的 每 一 个 . 令 U, 是 此 推销 商 直接 的 从 城 
市 i 到 城市 j 所 得 到 的 报酬 .用 模拟 退火 法 来 估计 此 推销 商 获 得 最 大 可 能 的 回 
报 . 


218 


WOE- -E = 一 
若干 动态 系统 的 模拟 


如 果 我 们 计划 建立 某 个 系统 ,就 要 在 事前 对 该 系统 作出 准确 的 评价 ,以 避 
免 不 必 要 的 损失 . 最 好 的 方法 就 是 对 所 要 研究 的 系统 预先 进行 模拟 ,建立 模拟 
模型 ,通过 模拟 模型 对 该 系统 的 某 种 特征 或 部 分 状态 进行 分 析 ,以 得 到 有 用 的 
信息 . 为 此 ,本 章 将 介绍 若干 动态 系统 的 模拟 . 


9.1 追逐 问题 的 模拟 


问题 1 在 正方 形 ABCD 的 4 个 顶点 各 有 一 人 . 在 某 一 时 刻 ,4 人 同时 出 
发 并 以 匀速 "走向 顺 时 针 方 向 的 下 一 个 人 . 如 果 他 们 的 方向 始终 保持 对 准 目 
标 , 试 模拟 出 每 个 人 的 路 径 ,并 判断 他 们 是 否 能 够 汇合 . 

为 了 解决 这 个 问题 ,首先 建立 平面 直角 坐标 系 , 以 时 间 间 隔 At 进行 采样 ， 
在 每 一 时 刻 上 计算 每 个 人 在 下 一 时 刻 # + Ai 时 的 坐标 . 因为 4 个 人 的 情形 一 
样 ,故我 们 不 妨 设 甲 的 追逐 对 象 是 乙 ,在 时 刻 1, 甲 的 坐标 为 (2 ,7 )， 乙 的 坐 
标 为 (”: ,y: ) , BRA P ERTZ] t + Ar 的 坐标 为 (x, + vAtcos0,y + vAtsinð) , 其 
中 


cos0 = —,sin8 => "a = / (x, — x, )° + (y; - y). 


选取 足够 小 的 Ar, 模拟 到 甲 乙 的 距离 小 于 Ar 为 止 . 
以 下 是 模拟 的 R 程序 ,4,B,C,D 的 4 个 点 的 初始 位 置 为 4(1,0), B(1, 
1), C(1,0), D(0,0). 
trace =function( delta_t=0.01,eps=0.01) Í 
### 画 出 A,B,C,D 和 0 五 点 的 初始 位 置 ,并 作 标记 
plot(c(0,1,1,0),c(0,0,1,1) ,xlab=" ", ylab=" ") 
text(0 ,1 ,labels="A" ,adj=c(0.3,1.3)) 
text(1 ,1 ,labels="B" ,adj=c(1.5,0.5)) 
text( 1 ,0 ,labels="C" ,adj=c(0.3,-0.8) ) 
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text(0,0 ,labels="D" ,adj=e(-0.5,0.1)) 
### 皇 阵 x 是 A,B,C,D,A 五 点 的 横 坐 标 , 矩阵 y 是 A,B,C,D, 
A 五 点 的 纵 坐 标 
x=matrix(e(0,1,1,0,0) ,nrow=1);y=matrix(e(1,1,0,0,1), 
nrow=1) 
j=0 
repeat| j=j+1 
d=0; a=0;b=0 
for(i in 1:4)] 
dli] =sqrt( (x[j,i+1]-x[j,i])"2+(y[j,i+1]-y[j,i])2) 
ali] =x[j,i]+delta t* (x[j,i+1]-x[j,i])/d[i] 
b[i]=y[j,i]+delta_t x (y[j,i+1]-y[j,i])Zda[il 
} 
if( max( d) <eps) break 
a[5]=a[1];b[5]=b[1] 
x=rbind(x,a);y=rbind(y,b) 
l 
lines(x[1:j,1],y[1:j,1],col=5);lines(x[1:j,2],y[1:j,2], 
col=2) 
lines(x[1:j,3] ,y[1:j,3],col=3);lines(x[1:j,4],y[1:j,4], 
col=4) 
points(a[2],b[2],col=" yellow" ) 
text(a[2] ,b[2] ,labels="0" ,adj=c(-1,0.3)) 
list(x=a[2] ,y=b[2]) 
| 
运行 程序 trace(0.01,0.02) 得 到 图 9-1, 从 图 中 可 看 出 他 们 能 够 相聚 ,是 聚 于 
点 0(0.5,0.5). 
问题 2 一 列 火 车 从 A 站 开 往 B 站 , 某 人 每 天 赶 往 B 站 上 火车 . 他 已 了 解 
到 火车 从 A 站 到 B 站 的 运行 时 间 是 服从 均值 为 30 分 钟 .标准 差 2 分 钟 的 正 
态 随机 变量 . 火车 大 约 下 午 13 :00 离开 A 站 ,此 人 大 约 13:30 到 达 B 站 . 火车 
离开 A 站 的 时 刻 及 概率 如 表 9-1 所 示 . 此 人 到 达 B 站 的 时 肇 及 概率 如 表 9-2 
所 示 . 问 他 能 赶 上 火车 的 概率 是 多 大 ? 
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0.0 0.2 0.4 0.6 0.8 1.0 
图 9-1 追逐 问题 
表 9-1 火车 离开 A 站 的 时 刻 及 概率 表 9-2 人 到 达 B 站 的 时 刻 及 概率 
火车 离 站 时 刻 | 13:00 13:05 13:10 人 到 站 时 刻 |13:28 13:30 13:32 13:34 


概率 0.7 0.2 0.1 概率 0.3 0.4 0.2 0.1 


设 式 表示 火车 从 A 站 出 发 的 时 刻 , 了 表示 火车 从 A 站 到 B 站 的 运行 时 
E, Z 表示 此 人 到 达 B 站 的 时 刻 . 令 13 时 为 起 始点 , 记 为 0, 则 了 ~ N(30,4), 
E X, Z 的 分 布 分 别 如 表 9-3、 表 9-4 所 示 . 


表 9-3 XR Ë 表 9-4 Z 的 分 布 律 
BF) X 0 5 10 时 刻 Z 28 30 32 34 
概率 p 0.7 0.2 0.1 概率 p 0.3 0.4 0.2 0.1 


根据 本 问题 的 含义 知 此 人 能 够 赶 上 火车 的 充分 必要 条 件 是 X+Y > Z, 其 
概率 为 6=PIX+Y > Z]. 在 计算 此 概率 时 , 既 涉 及 离散 型 随机 变量 又 涉及 连 
续 型 随机 变量 ,难以 用 解析 的 方法 得 到 此 概率 . 下面 我 们 通过 模拟 方法 来 估计 
此 概率 0. 

模拟 算法 如 下 : 

Step 1: 从 七 中 抽取 xi ,xx 个 值 , 从 了 中 抽取 7 y. AZ 


221 





统计 模拟 及 其 RR 实现 —— T. 


中 抽取 Zi 22 39" Z. 


Step 2:4 
E alai Z 1 
TESNEL 
模拟 程序 如 下 ， 


### 给 定 精度 eps=0.01 的 概率 估计 ,pl 为 X 的 概率 向 量 ,p3 为 Z 的 
概率 向 量 
###par 为 正 态 分 布 的 参数 均值 和 标准 差 向 量 
train=function( pl ,par, p3 ,eps=0.01)1| 
I=0 
k=100 
x=sample(c(0,5,10) ,k,prob=pl,replace=TRUE) 
y=rnorm(k,par[1],par[2]) 
z=sample(c(28 ,30 ,32,34) ,k ,prob=p3 ,replace=TRUE) 
for(i in 1:k)| 
if(x[i]+y[i]>z[i]) H i]=1 
ele I[i]=0 
l 
repeat | 
if(sd(I/k)<eps) break 
k=k+1 , 
x[k] =sample(c(0,5,10),1,prob=p1) 
y[k] =rnorm(1 ,par[ 1] ,par[2]) 
z[k] =sample( c(28 ,30,32 ,34) ,1 ,prob=p3) 
H k]=ifí(x[k]+y[k]>z[k]) 1 else 0 
| 
list(th=mean(I),k=k) 
| 
给 出 函数 中 的 参数 为 
pl=c(0.7,0.2,0.1);par=c(30,2);p3=c(0. 3,0.4,0.2,0.1). 


运行 train( pl1 ,par,p3 ,0.0001) 得 到 此 人 能 赶 上 火车 的 概率 近似 为 6 = 0. 63. 
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9.2 Daubechies 小 波 函 数 计算 


小 波 是 近 二 十 年 来 得 到 广泛 注意 的 数学 工具 ,可 以 应 用 于 各 种 数学 分 析 
问题 . 小 波 中 一 种 重要 的 函数 称 为 尺度 函数 (Scale Function) , 它 满足 所 谓 双 太 
度 方程 : 


p(x) =V2 》 h, $(2x - k). 
一 种 特殊 的 尺度 函数 是 只 在 有 限 区 间 上 非 零 , 称 为 紧 支 集 . 紧 支 集 尺度 函数 可 
以 在 给 定 和 hi 后 用 以 下 和 迭代 公式 生成 : 
n(x) = I _0.5.0.5](%) ; 


n.a (z) = V2 $ hn, (2x — k), 
其 中 六 是 正 整数 . N =2 BF, h, = 0. 48296913145, h, = 0. 836516303738, h, = 
0. 224143868042 , h, =- 0. 129409522551. 已 知 p(x) 的 支 集 为 [0,2N - 1], 
7,(x) 的 支 集 包 含 于 [ - 0.5,2N - 1] rh. 作为 例子 ,下 面 来 编写 计算 px) 的 
程序 . 

(1) 因 为 pl) 是 函数 ,所 以 我 们 只 能 得 到 * 在 $(x) 的 支 集中 的 一 些 等 
间隔 点 上 的 函数 值 . 为 了 用 迭代 计算 这 些 值 , 先 写 出 算法 的 R 代码 (基本 结构 
使 用 R 语言 但 某 些 复杂 操作 用 自然 语言 描述 ) : 

aubechie. phi=function( nsample =256 ,nrep =20) | 
需要 计算 的 样本 点 的 个 数 
和 迭代 次 数 
x= 需 要 计算 的 x 坐标 向 量 
N=2 
h=c(0.48296913145 ,0. 836516303738 ,0.224143868042 , -0. 129409522551 ) 
y0= 向 量 , 保 存 m(x) 在 n=0 时 的 初 值 ， 

当 x 在 [-0.5,0.5] 内 时 为 1, 其 他 为 0 
for(r in nrep) |# 迭代 即 循环 

y= 与 x 长 度 相 同 的 零 向 量 
for(k in 1: (2 * N-1) ) {# 计 算 公式 中 的 求 和 
yk=m(. ) 在 自 变量 取 2x-k 处 的 值 * sqrt(2)， 

用 上 一 步 的 y0 来 表达 

y=y+yk 

| # fork 





# nsample 





# nrep 
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yO=y# 把 新 的 nm(. ) 放 进 yo 中 

# 作为 下 一 步 的 开始 值 

}# forr 

把 x 和 y 只 保留 x 在 [0,2 * N-1] 中 的 部 分 返回 x 和 y 作 为 (x[i]， 
h(x[i])) 

] 

(2) 下 面 逐步 细 化 这 个 算法 ,并 根据 需要 对 算法 进行 必要 的 修改 . 设 
x[i]=a+(i-1)Z(nsample-1) * (b-a) ,我 们 发 现 ,这 个 算法 中 的 关键 问题 是 
如 何 把 2x-k 处 的 函数 值 从 y0 中 查 到 . 理想 的 情况 是 2xf i] -k 恰好 等 于 某 个 
x[j] ,这 时 eta(2 - x[i]-k)= eta(x[j])=y0[j] .如果 2x[i]-k 在 两 个 x[j] 之 
间 , 可 以 取 最 近 的 一 个 x[j] ,然后 使 用 y0[ 让 .经 试验 ,这 样 的 做 法 不 能 保证 迭 
代 收 敛 . 所 以 ,应 该 调整 算法 使 得 每 一 个 2x[i] -k 都 恰好 落 在 某 个 x[j] 上 面 . 
2( 


+ a) a +i 
n 


RP n ARERR. 由 上 式 得 
j=1+2G-1)- (k+1) 9- 


所 以 只 要 n-1 能 被 b-a 整除 即 可 .为 此 , 取 a=-1,b=2N-1,n=1+(2N)m,m 
为 整数 .但 是 ,这 样 取 的 个 点 包含 了 区 间 [ -1,0) ,这 在 最 后 的 结果 中 是 要 于 


弃 的 ,所 以 如 果 采 样 至 少 要 nsample 个 点 的 话 , 应 该 保证 2 _ 1) 大 于 或 


等 于 nsample. 
(3) 如 果 必 须要 求 按 指定 的 采样 点 数 给 结果 , 则 可 以 用 线性 插值 来 得 到 
所 需 的 结果 . 线性 插值 的 函数 为 approx(x,y,n) ,其 中 (x,y) 为 要 插值 的 散 点 
(两 个 向 量 ) n 是 要 求 的 采样 点 数 ( 从 x 的 最 小 值 到 最 大 值 均匀 采样 ). 
(4) 最 后 的 程序 如 下 : 
### Wavelet.r 
#### Daubechies 迭代 有 限 支 集 正 交 小 波 基 构 造 
Daubechies. phi = function ( nsample = 256 ,nrep = 20 ,plot. it=T, 


2a 





=- a), 


debugging = F ,nsample. exact=F) | 
# nsample :采样 点 数 
# plot. 让 :是 否 每 次 绘图 
# debugging :是 否 输出 调试 信息 
#nsample. exact :是否 严格 要 求 采 样 点 数 
224 








第 9 章 若干 动态 系统 的 模拟 2 一 一 


# 取 FALSE 时 可 以 适当 放大 

# 注意 :所 有 eta(x) 的 支撑 并 集 为 [ -0.5,2N-1]， 

# 但 为 了 和 迭代 时 计算 的 点 都 落 在 采样 点 上 所 以 要 把 左 端 点 设 为 -1, 把 采 
样 个 数 适 当 放 大 

N=2 

a=-1 

b=2 *N-1 # 采样 区 间 [-1,2N-1] 
ns= ceiling( ( nsample * (2 + N)/(2 *N-1)-1)/(2 *N)) * (2 *N)+Il 

# ns: 新 的 采样 点 数 

m= (ns-1)/(2*N) 

# m:phi(x) 的 采样 密度 (x 轴 每 单位 有 多 少 个 点 ) 
h=c(0.48296913145 ,0. 836516303738 ,0. 224143868042, 
-0.129409522551) * sqrt(2) 
x=seq(from=-1,to=2 + N-1 ,length=ns) # x:phi(x) 的 采样 位 置 
y0 =numeric( ns) # 初 始 函 数 
condl =(x>=-0.5& x<=0.5) 
yO[ cond1] =1.0 
yO[! condl ] =0.0 
for(r in 1:nrep) | HERRA 
if( debugging &&plot. it) | 

plot(x,y0 ,type="1" ,main = paste( " Iteration" ,r) ) 
#locator( n=1) } 
y =numeric( ns) HERRAR 
for(k in 0: (2 * N-1))| 

# 首 先 计算 eta(2 * x-k), M x X MF a,a+1/m,a+2/m,=:,b=a+ 
(ns-1)/m 共 ns 个 点 ,# 我 们 只 要 找 出 2x -天 对 应 的 下 标 即 可 . 这些 下 
标 里 有 些 是 出 界 的 ,只 要 找 在 1 到 ns 内 即 可 

yk =numeric( ns) # 保存 eta(2 * x-k) 
i=seq(along=x) 
j=2*i-1-(k+1) *m 
cond2 = (j>=1)&(j<=ns) 
yk[ cond2] =y0[j[cond2] ] +h[k+1] 
y=y+yk 
] #k 
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y0=y # 新 的 迭代 初 值 
] #r 
xphi=x[ (1+m) :ns] 
yphi=y[ (1+m) :ns] 
ns = ns 一 mm 
# 当 前 phi(x) 从 0 到 2N-1 采样 的 个 数 , 去 掉 了 [ -1,0) 的 mm 个 点 
if( plot. it) Í 
plot( xphi,yphi,type="]" ,main=express(phi(x) ) ,xlab="x", 
ylab=" ") 
abline(h=0) 
| 
if( nsample. exact) {# 必 须要 求 nsample 个 点 . 
# 使 用 线性 插值 (approx ,approxfun ) 
# 使 用 样 条 插值 (spline ,splinefun ) 
xyl = approx( xphi, yphi,n =nsample) 
xphi =xy1 $x 
yphi=xyl $y 
| 
invisible( list( xphi = xphi, yphi= yphi) ) 
| 


0.5 


0.0 


-0.0 0.5 1.0 1.5 2.0 2.5 3.0 
图 9-2 小波 采样 图 
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9.3 排队 系统 


1. 单 服务 员 的 排队 系统 


考虑 顾客 按照 具有 强度 函数 和 (i) ,t > 0 的 非 齐 次 Poisson 过 程 来 到 一 个 
服务 站 ,服务 站 中 只 有 一 个 服务 员 . 当 服 务 员 空闲 时 , 若 有 顾客 到 来 , 则 立即 接 
受 服务 ;否则 这 个 顾客 就 要 排队 等 候 . 当 这 个 服务 员 完 成 了 对 一 个 顾客 的 服务 
时 , 若 有 顾客 排队 ,就 对 等 待 时 间 最 长 的 顾客 服务 ( 即 先 到 先 服务 ) ; 若 没有 顾 
客 排队 , 则 保持 空闲 直到 下 一 个 顾客 来 到 . 称 一 个 顾客 从 接受 服务 到 结束 服务 
为 一 个 服务 周期 ,在 此 周期 内 ,系统 中 的 顾客 数 称 为 队长 二 一 般 来 说 ,一 个 顾 
客 所 接受 服务 的 时 间 是 一 个 具有 概率 分 布 G 的 随机 变量 , 且 与 其 他 顾客 所 接 
受 的 服务 时 间 相 互 独立 ,也 与 来 到 过 程 相互 独立 . 在 一 个 服务 周期 了 内 ,此 服 
务 员 只 对 在 时 刻 7 之 前 到 达 的 所 有 顾客 服务 ,在 7T 之 后 再 不 允许 顾客 进入 此 
RA. 

假设 我 们 对 模拟 上 述 系 统 来 决定 如 下 的 量 感 兴趣 : 

(1) 一 个 顾客 花费 在 这 个 系统 中 的 平均 时 间 , 即 排队 时 间 与 接收 服务 时 
. 间 之 和 ，; 

(2) 最 后 离开 的 顾客 超过 时 刻 T 的 平均 时 间 , 即 这 个 服务 员 能 够 下 班 的 
平均 时 间 . 

为 了 模拟 上 述 系 统 ,我 们 引进 以 下 变量 : 

时 间 变 量 + 

计数 变量 — N, :到 时 刻 上 时 来 到 的 顾客 数 ; 

N, :到 时 刻 i 时 离开 的 顾客 数 . | 

系统 状态 变量 SS n :在 时 刻 上 时 系统 中 的 顾客 数 . 

因为 当 一 个 顾客 来 到 或 者 一 个 顾客 离开 时 都 会 改变 以 上 的 量 , 所 以 我 们 
把 它们 看 做 “事件 ”. 也 就 是 ,有 两 个 类 型 的 事件 :来 到 和 离 去 . 事件 清单 包含 
着 下 一 个 顾客 来 到 的 时 间 和 正在 接受 系统 服务 的 顾客 的 离 去 时 间 . 从 而 事件 
清单 为 

EL = 如 tp 

其 中 由 是 在 上 之 后 下 一 个 顾客 来 到 的 时 间 , to 是 正在 接受 服务 的 顾客 完成 服 
务 的 时 间 . 如 果 没 有 顾客 接受 服务 , 则 令 i=. 

输出 变量 为 : 4(i) , 第 i 个 顾客 来 到 的 时 间 ; DO), 第 i 个 顾客 离 去 的 时 
间 ; 7,, 最 后 一 个 顾客 离开 系统 超出 7 了 的 时 间 . 

假设 服务 时 间 为 了 服从 分 布 G, 模拟 步骤 如 下 : 
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Step 1 :初始 步 , 令 1 = N, = No = 0,n = 0, ÆR T,, 3Ë2- t, = T ,typ = œ. 

Step 2: 如 果 min{6 ,tpi < T, 转 到 Step 3. 

Step 3:40 R 1 < t, B t, < T, EE tet, N — N, +l, nen +1; 
7 并 令 t = ;车 n=1, FEY, #9 t, = t + Y. KRKE AN, ) = t (因为 
顾客 N, 在 时 刻 上 到 达 ) ,返回 Step2. 

Step 4: 否 则 ( 即 is <4 H t, sT), EE + = tnn -1,N,—N, + 1; 40 
An = 0, t, = % ;否则 产生 Y ,并 令 i, =t + 了 收集 数据 D(N,) = t. 返回 
Step 2. : 

Step 5 :否则 ( 即 min(1, ,i) > 了 ) , 转 到 Step 6. 

Step 6: 如 果 n > 0, EE t=t, nen- 1, No — Np +1;WẸ n > 0, 产 
Æ Y, 并 令 tp = t + 了， 收集 数据 D(N,) = t. 返回 Step 5. 

Step 7: 否 则 ( 即 ” = 0) ,停止 并 收集 数据 T = max|: - T,0}. 

注意 :上 述 算法 收集 到 的 数据 N. (整个 到 达 的 总 数 ) ,等 于 N, ( 离 去 的 总 
数 ). 对 每 个 i,i= 1,2,…,NV, 我 们 得 到 AG (顾客 i 到达 的 时 间 ) 和 D(i) 
(顾客 i 离 去 的 时 间 ) ,从 而 得 到 第 i 个 顾客 花 在 这 个 系统 中 的 时 间 为 D(i) - 
ACi). 同时 我 们 还 得 到 T, (最 后 一 个 顾客 离开 系统 超出 7 的 时 间 ). 

每 次 收集 到 上 述 数 据 就 称 一 个 模拟 过 程 完成 . 在 每 个 模拟 过 程 完成 之 后 ， 
再 将 之 初始 化 ,直到 收集 到 足够 多 的 数据 为 止 . 我 们 可 以 用 T, 的 平均 值 来 估 
计 最 后 一 个 顾客 离开 系统 时 超过 了 7 的 平均 时 间 ; 同 样 ,用 D - 4 的 平均 值 来 估 
计 一 个 顾客 花 在 系统 中 的 平均 时 间 . 

对 应 的 R 程序 为 (保存 名 为 que. sim. R) 

### 子 程序 TS 表示 用 稀释 法 产生 在 时 刻 s 后 第 一 位 顾客 的 来 到 时 间 
TS=function(lambda,g,s) |#g(t) 为 强度 函数 ,lambda 为 g(t) 的 最 大 值 
t=s;Ts=0 
repeat | 
U=runif(1) 
t=t~l/lambda * log( U) 
Ul=runif(1) 
if(Ul<=g(t)/lambda) break 


} 
### 在 时 间 T 内 产生 顾客 花费 在 系统 中 的 平均 时 间 及 服务 员 超时 的 
时 间 
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MG1 =function( TS,T ,mu) {# 服 务 时 间 Y 服从 参数 mu 指数 分 布 
t=0;nA=0;nD=0;n=0;A=0;D=0;N=0 
U =runif(1) 
tA =TS( lambda, g,t) ;tD = Inf 
repeat | 

if(tA<=tD & tA<=T) | 
t=tA;nA=nA+1;n=n+l 
tA=TS(lambda,g,t) 
if(n==1){ 

U =runif(1) 
tD=t-1/mu * log( U) 

| 
A[nA]=t 

| 

else if(tD<=tA & tD<=T) Í 
t=tD;n=n-1 
nD=nD+1 
if(n==0) tD=Inf 
else {Ul=runif(1) ;tD=t-1/mu * log(U1)] 
D[nD]=t 
N[nD] =n 

| 

else if(tA>T&tD>T) break 

l 
repeat | 

if(n<=0)break 

t=tD;n=n-1;nD=nD+1 

D[nD] =t 

N[nD] =n 

if(n>0) | 
U2 =runif( 1) ;tD =t-1/mu * log( U2) 

| 

l 

Tp=max(t-T,0) 
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list(w=mean(D-A) ,gohome=Tp,L=mean(N)) 
| 
【 例 9.1】 某 理 发 店 只 有 一 名 理发 师 为 顾客 服务 ,按照 先 到 先 服务 原则 
对 顾客 进行 服务 . 假设 该 理发 店 每 天 的 工作 时 间 为 上 午 8 点 到 下 午 8 点 ,在 此 
段 时 间 内 的 顾客 都 必须 提供 服务 ,而 下 午 8 点 后 不 再 接受 新 顾客 . 假设 顾客 是 
以 参数 为 A = 1.2 人 /小 时 的 Poisson 过 程 到 达 该 理发 店 , 且 每 位 顾客 的 理发 时 
间 服 从 指数 分 布 ,平均 需要 30 分 钟 . 试 估计 顾客 在 理发 店 的 平均 时 间 、 平 均 队 
长 和 该 理发 师 的 平均 加 班 时 间 . 模拟 100 次 ,再 模拟 1000 次 . 
解 根据 题 意 , 7 = 12, A =2, j=2, 调用 程序 
source( " que. sim. R" ) 
lambda=1.2;g=function(x)1.2;T=12;mu=2 连续 运行 1000 次 
MGI]1(TS,T,mu) 
取 平 均 得 到 每 个 顾客 在 理发 店 的 平均 时 间 为 W = 1.0145 小 时 ,平均 队长 为 
1.010685 人 ,该 理发 师 的 平均 加 班 时 间 0.721491 小 时 . 如 果 该 理发 师 想 保 证 
按时 下 班 回 家 ,就 要 在 离 下 班 时 间 前 30 分 钟 不 再 接受 新 的 顾客 . 
2. 两 个 服务 员 的 并 联 排队 系统 


考虑 有 两 个 服务 员 的 模型 ,顾客 按照 非 齐 次 的 Poisson 过 程 来 到 . 如 果 两 
个 服务 员 都 是 忙 的 , 则 来 到 的 顾客 将 进入 排队 等 候 的 队伍 中 ,车 服务 员 1 E zs 
闲 的 ,顾客 就 接受 服务 员 1 的 服务 ,否则 就 接受 服务 员 2 的 服务 . 当 顾 客 接受 
完 一 个 服务 员 的 服务 (不 管 是 哪个 服务 员 的 服务 ) 后 将 离开 此 系统 .在 排队 等 
候 的 队伍 中 (如 果 有 顾客 排队 ) 等 待 时 间 最 长 的 顾客 就 接受 服务 . 每 个 顾客 接 
受 服务 员 i 的 服务 时 间 有 分 布 函 数 G,,i = 1 ,2. 

假设 我 们 要 模拟 上 述 模型 来 分 析 每 个 顾客 花费 在 这 个 系统 中 的 总 时 间 以 
及 每 个 服务 员 服 务 的 顾客 数 . 因为 有 多 个 服务 员 ,顾客 将 不 必 按 他 们 来 到 的 顺 
序 离开 ,从 而 要 知道 哪 一 个 顾客 将 离开 此 系统 就 要 根据 服务 的 完成 情况 来 确 
定 , 所 以 我 们 必须 了 解 哪些 顾客 在 服务 系统 中 . 当 顾客 到 达 时 我 们 对 之 进行 纺 
号 ,例如 第 一 个 到 达 的 顾客 编号 为 1 ,下 一 个 编号 为 2, 等 等 . 因为 顾客 按 他 们 
的 到 达 次 序 接受 服务 ,从 而 知道 哪个 顾客 正在 接受 服务 以 及 有 多 少 顾客 在 队 
伍 中 等 待 . 假设 顾客 i 和 j 正 在 接受 服务 ,其 中 i<j, 有 n-2> 0 个 顾客 正在 
排队 . 因为 在 第 j 个 顾客 接受 服务 之 前 有 不 超过 j 的 顾客 数 已 经 接受 了 服务 ， 
因此 没有 一 个 编号 数 超过 j 的 顾客 接受 完 服务 (因为 他 们 在 顾客 ; 或 者 7 之 前 
接受 服务 才能 如 此 ) ,从 而 知 顾客 J + 1,… ,i + n - 2 正在 排队 . 

为 了 分 析 此 系统 我 们 引入 下 述 变 量 . 

时 间 变 量 t. 
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系统 状态 变量 55. 

如 果 有 nn 个 顾客 在 系统 中 , 且 第 i 个 顾客 正在 接受 服务 员 1 的 服务 ,第 i 
个 顾客 正在 接受 服务 员 2 的 服务 时 , 记 SS=(n,ii i). 当 系统 空闲 时 , 记 SS = 
(0); 当 系统 中 只 有 编号 为 7 的 顾客 并 正在 接受 服务 员 1 的 服务 时 , 记 SS=(1， 
j,0) ;或 者 当 系 统 中 只 有 编号 为 了 的 顾客 并 正在 接受 服务 员 2 的 服务 时 , 记 
SS = (1,0,j). 

计数 变量 N, :到 时 刻 1 时 来 到 的 顾客 数 . 

C, :到 时 刻 :为 止 第 j 个 服务 员 已 服务 的 顾客 数 , j = 1 ,2. 

输出 变量 Aln) :第 nm 个 顾客 到 达 的 时 刻 , n > 1. 

D(n) :第 =” 个 顾客 离 去 的 时 刻 , n > 1. 

事件 清单 ta st ,ta. 

其 中 是 下 一 个 顾客 来 到 的 时 间 , t 是 正在 接受 服务 员 i 服务 的 顾客 的 
完成 服务 时 间 , i = 1,2. 若菜 时 刻 在 服务 员 i 前 没有 顾客 接受 服务 ,我 们 就 令 
t = % ,i = 1,2. 因此 ,事件 清单 总 是 由 3 个 变量 ,t,ts 组 成 . 

假设 Y, 是 具有 分 布 C, i = 1,2, 的 随机 变量 .模拟 算法 如 下 : 

Step 1 ;初始 步 , 令 t=N,=C,=C,=0,n=0,i=0,i =0, SS= (n,i, 
¿),A=0,D=0, ÆR T, E£ t = Ti, = = %. 

Step 2: 如 果 th > T E r, > T,t, > T, 跳 到 Step 6. 

Step 3:38 t, < h B t, < t,, Sitti N, — N, + 1,A(N,) — t, 产生 
下 一 个 顾客 的 到 达 时 刻 t- 

wÆ SsS=(0,0,0), $ i =max(i,i,) +1, 重 置 SS= (1,4,0), 产生 
Y, 并 令 =t + Y,; 

如 果 SS= (1, ,0), $i, =max(i,i) +1, E SS= (2,i,,i,) , P 
# Y, 3Ë > t, = t + Y,; 

如 果 SS= (1,0,4), $i =max(i,i) + 1, Æ SS= (2,i,i), J” 
Y 3EZ t, =t +Y,; 

如 果 n > 1, 重 置 SS = (n+ 1,i,i,). 

返回 Step 2. 

Step 4: 如 果 < t B t, <t, $ t=, CG eC +1, D(i,) = t, 

HHE n = 1, RER SS=(0,0,0) Ñt =% ; 

如 果 m=2, 重 置 SS= (1,0,;,) fli, =% ; 

如 果 n > 2, i, =max(i,,L,) +1, #BSS=-(n- 1)， 人 成 了 
并 令吉 =i + Y,. 

返回 Step 2. 


231 








i 统计 模拟 及 其 及 实现 P 


Step 5: 如 果 i < t, B t, <t, t=, C, — C, + 1, D(ü,) = t, 
如 果 n =1, RER SS=(0,0,0) Mt == ; 
如 果 nn = 2, 重 置 SS= (1,ii,0) fl t, = @ ; 
WR n > 2, $i, =mar(i,i) +1, 重 置 SS= (n-1,i,4), ÆR Y, 
3Ë t, = t + Y,. 
返回 Step 2. 
Step 6: 如 果 SS=(0,0,0) , 转 到 Step 9. 
Step 7: 如 果 SS= (1,i,,0), EE SS=(0,0,0), D(i)= L, C, — G, + 1. 
如 果 SS= (1,0,4), EE SS=(0,0,0) , D(¿,) = t,, C, — C, + 1. 
WMR t <h, tt, — CG, + 1,D[i ] =t, 
车 n=2, WAE SS= (1,0,;,) ; 
# n > 2, MS i =max(i,,i,) +1, E SS= (n-1,i,i), 2 Y, 
并 令 t = t + Y.. 
WR r S, Stt, C, + 1,D[i,] = t, 
#n=2, WEE SS= (1,i,,0) ; 
# n > 2, WS i =max(i,i) +1, 重 置 SS= (n - 1,1,4), P## Y, 
#S t, = t + Y,. 
Step 8 :返回 Step 6. 
Step 9: 输 出 数据 清单 4,D,C ,C,. 
如 果 我 们 根据 上 述 程序 模拟 这 个 系统 ,并 在 预先 确定 的 停止 点 停止 此 模 
拟 , 则 通过 使 用 输出 变量 以 及 计数 变量 C, ,C, 的 值 ,可 得 到 不 同 的 顾客 来 到 的 
时 刻 和 离 去 时 刻 以 及 每 个 服务 员 服 务 的 总 人 数 等 数据 . 
其 R 程序 如 下 : 
### 产 生 顾 客 到 达 时 间 的 非 齐 次 Poisson 过 程 的 子 程序 
TS=function(lambda,g,s) 1#g(t) 为 强度 函数 ,lambda 为 g(t) 的 最 大 值 


t=s 

repeat | 
U=runif(1) 
t=t-1/lambda * log( U) 
U1 =runif(1) 


if(Ul<=g(t)/lambda) break 
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### 并 联 排队 系统 程序 
### 假设 服务 员 1 和 服务 员 2 对 顾客 服务 时 间 服 从 参数 分 别 为 
lambdal ,lambda2 的 指数 分 布 ,T 为 时 间 周 期 
queue2 = function( TS ,T ,lambda1 ,lambda2 ) Í 
t=0;nA=0;C1=0;C2=0;SS=c(0,0,0) 
D=0;A=0;t] =Inf;t2 =Inf;il =0;i2=0 
tA=TS(lambda,g,0) 
repeat Í 
if( tA>T&t1>T&t2>T) break 
if(tA<=t1&tA<=12) | 
t=tA;nA=nA+1;tA=TS(lambda,g,t) 
A[nA]=t 
if(all(SS= =c(0,0,0))){il=max(il ,这 )+1 
SS=c(1,il,0) ;tl =t-1/lambda1 * log(runif(1)) 
l 
else if(all(SS==c(1,il,0))) {i2=max(il ,i2)+1 
SS=c(2,il ,i2) 
t2 =t-1/lambda2 * log( runif(1)) 
} - 
else if(all(SS==c(]1,0,i2))) {il =max(il,i2)+1 
SS=c(2,il,i2) 
tl =t-1/lambda1l * log( runif(1)) 
l 
else if(SS[1]>=2) Í| 
 SS=e(SS[1]+1,il,i2) 


l 
else if(tl<tA&t1<=t2) | 

t=t1;C1=C1+1;D[il]=t 

if(SS[1]J==1)1 SS=c(0,0,0);t1=Int] 

else if(SS[1] ==2)| SS=c(1,0,i2);tl=Inf | 

else if( SS[1]>2){ il=max(il,2)+1;S$=c(SS[1]- 
1,il,i2) 

tl =t-1/lambda1 * log(runif(1)) 
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l 
else if( 包 <tA&t2<tl) | 
t=t2;C2=C2+1;D[i2] =t 
if(SS[1]==1){ SS=c(0,0,0);t2=Inf | 
if(SS[1]==2)1 SS=e(1,il,0);t2=Inf | 
if(SS[1]>2)] i2=max(il,i2)+1;SS=c(SS[1]- 
1,il ,i2) 
t2 =t-1/lambda2 * log( rmnif(1)) 


| 
repeat | 
if(all(SS==c(0,0,0))) break 
else if(all(SS==c(1,il,0))) IC1=C1+1;SS=c(0,0,0); 
D[il]=t1} 
` else if(all(SS==c(1,0,i2))) [C2=C2+1;SS=e(0,0,0); 
D[i2] = 了 2| 
else if(SS[1]>=2)] 
if(t1<t2)1 
t=t1;C1=CI+1;D[il]=t 
(SS[1] ==2)| SS=e(1,0,i2)] 
else if(SS[1] >2)| il =max(il ,i2)+1;SS= 
c(SS[1]-1,il,i2) 
tl =t-1/lambda1 * log( runif(1)) 


| 
else | 
t=t2;C2=C2+1;D[i2]=t 
if(SS[1]==2){ SS=e(1,i1,0) | 
else if( SS[1]>2) Í i2=max(il,i2)+1;SS=c(SS[1]- 
1,i1 ,12) 
t2 =t~1/lambda2 * log( runif(1)) 
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list(arriv=A,depart=D,C1=C1,C2=C2) 
l 

【 例 9.2】 假设 某 银 行 有 两 个 服务 员 为 顾客 服务 ,服务 周期 为 星 上 8:00 
到 晚上 6:00 共 10 小 时 .顾客 按照 参数 为 A = 3 人 /小 时 的 齐 次 Poisson 过 程 来 
到 .如果 两 个 服务 员 都 是 忙 的 , 则 来 到 的 顾客 将 进入 到 排队 等 候 的 队伍 中 ,车 
服务 员 1 是 空闲 的 ,顾客 就 接受 服务 员 1 的 服务 ,否则 就 接受 服务 员 2 的 服 
务 . 当 顾客 接受 完 一 个 服务 员 的 服务 后 将 离开 此 银行 ,在 排队 等 候 的 队伍 中 
(如 果 有 顾客 排队 ) 等待 时 间 最 长 的 顾客 就 接受 服务 . 每 个 顾客 接受 服务 员 i, 
i = 1,2 ,服务 时 间 服 从 速率 分 别 为 4 人 /小 时 与 3 人 /小 时 的 指数 分 布 . 试用 模 
拟 的 方法 求 出 顾客 在 此 系统 中 的 平均 逗留 时 间 及 各 服务 员 平 均 每 天 的 服务 顾 
客 数 . 

据 题 意 ,了 T= 10 ,lambda=3,g=function(x)3，lambdal =4, lambda2 = 3 , 运 
行 queue2( TS, T,lambdal ,lambda2 ) 30 天 得 到 每 个 顾客 的 平均 逗留 时 间 为 
0.31 小 时 ,服务员 1 平均 每 天 服务 的 顾客 数 为 19.13 人 ,服务 员 2 平均 每 天 服 
务 的 顾客 数 为 10.17 人 ,银行 30 天 内 大 约 有 17 天 需要 加 班 , 且 平 均 加 班 时 间 
为 0.25 小 时 . 据 此 ,银行 在 下 班 前 的 半 小 时 内 谢绝 顾客 来 到 是 合理 的 . 

3. 两 个 服务 员 的 串联 排队 系统 

考虑 一 个 有 两 个 服务 员 的 系统 ,在 这 个 系统 中 ,顾客 按照 非 齐 次 的 Pois- 
son 过 程 来 到 ,每 个 到 达 的 顾客 首先 接受 第 一 个 服务 员 的 服务 ,其 服务 完成 之 
后 再 接受 第 二 个 服务 员 的 服务 .这样 的 系统 称 为 串联 排队 系统 . 如 果 服 务 员 1 
是 空闲 的 ,来 到 的 顾客 就 接受 服务 员 1 的 服务 ;否则 ,来 到 的 顾客 就 进入 到 等 
候 接受 服务 员 1 服务 的 队伍 中 排队 . 类 似 地 , 当 顾 客 接 受 完 服务 员 1 的 服务 
后 ,如 果 服 务 员 2 是 空闲 的 ,此 顾客 就 接受 服务 员 2 的 服务 ;否则 ,此 顾客 就 进 
人 到 等 候 接 受 服务 员 2 服务 的 队伍 中 排队 . 在 接受 完 服务 员 2 的 服务 后 此 顾 
客 就 离开 系统 . 假设 每 个 顾客 接受 服务 员 i 的 服务 时 间 有 分 布 函 数 6;,i = 1, 
2. 假设 我 们 的 目的 是 研究 一 个 顾客 花 在 系统 中 接受 两 个 服务 员 服 务 的 时 间 
分 布 .我 们 采用 模拟 的 方法 实现 这 个 目的 .在 模拟 中 我 们 将 用 到 下 述 变量 . 

有 时间 变量 t. 

系统 状态 变量 SS. (n,,n,) A n 个 顾客 在 服务 员 1( 包 括 正在 接受 
服务 的 ) 前 排队 ,有 n, 个 顾客 在 服务 员 2( 包 括 正在 接受 服务 的 ) 前 排队 . 
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计数 变量 N, :到 时 刻 1 时 来 到 的 顾客 数 . 
N, :到 时 刻 上 时 离开 的 顾客 数 . 

输出 变量 A(n) :顾客 n 到 达 的 时 刻 , n > 1. 

An) :顾客 n 来 到 服务 员 2 处 的 时 刻 ,n > 1. 
D(n) :顾客 离开 的 时 刻 ,n > 1. f 

事件 清单 ba sti t. 

其 中 是 下 一 个 顾客 到 达 的 时 间 , i 是 正在 接受 服务 员 i,i=1,2, 服务 完 
成 的 时 间 . 如 果 在 服务 员 i 处 没有 顾客 接受 服务 ,那么 i; = % ,i = 1,2. 此 事件 
清单 总 是 由 3 个 变量 t ,t,t 构成 . 

BE Y 是 具有 分 布 G6,， i=1,2, 的 随机 变量 , C 为 系统 中 的 顾客 数 n, + 
n,. 模拟 算法 如 下 : 

Step 1 :初始 步 , 令 i=N,=n,=n,=0,N;,=0,C=0,4,=0,4,=0,D= 
0, 生成 7, ,并 令 = T,,t, = t, = m. 

Step 2: WR t > T B t, > T,t, > T, WSJ Step 9. 

Step 3:4 t, <t B t, <t, $ t=t , Ni=N,+l1,n =n, +1,A.(N,)= 
t, 产生 下 一 个 顾客 的 到 达 时 刻 t,- 

如 果 m = 1, 产生 了 并 令吉 = t + Y,. 

Step 4: 返 回 Step 2. 

Step 5: 如 果 t <t B t, <b, 令 f= 二 -1,nen,+1,A,(N,- 
n,) = t. 

WR n = 0, 令 五 = wm ;否则 ,如 果 n，> 0, 生成 了 并 令吉 = t + Y,. 
如 果 n, = 1, 生成 Y, 3Ë @* t, = t + Y,. 

Step 6: 返 回 Step 2. 

Step 7: 如 果 b < t Br, <t, t = t, N, —N, + 1, m= n, - 1, D(N,)= t, 
如 果 m = 0, E L = AUR n, > 0, ÆR Y, 3F t, = t +Y, 

Step 8 :返回 Step 2. 

Step 9 :如果 m 和 mw = 0 H n, = 0, 停止 并 转 到 Step 18. 

Step 10: 如 果 m > 0 或 mm > 0, 转 人 Step 11. 

Step 11; 如 果 < t, MS t=t, n n, -1,n,—n,+1,A,(N, -n,)= 
t. 转 到 Step 12. 

Step 12 :如果 mm =0, 4t = ;如 果 m > 0, ERY A a =i +V. 

Step 13 :如 果 n, = 1, ÆR Y, #S t, = t + Y,. 

Step 14: 返 回 到 Step 9. 
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Step 15:40 t > t, WS =t, nn - 1, N, —N, +1, $88] Step 16. 
Step 16: 如 果 m = 0, Et = wm ;否则 ,生成 Y, 3F2> t, = t + Y,, w 
D(N,) =t, C = n, + n,. 
Step 17 :返回 Step 9. 
Step 18 :输出 变量 4, ,4， ,D , C. 
其 R 程序 为 
queue3 = function ( TS, T, lambdal, lambda2 ) Í| # # TS 
为 产生 顾客 来 到 的 时 刻 函数 
t=0;nA=0;nl=0;n2=0;nD=0;C=0 
D=0;A1=0;A2=0;tl=Inf;t2 =Inf 
tA=TS(lambda,g,0) 
repeat | 
if(tA>T & t1>T & t2>T) break 
else if(tA = =min(tAÀ,t1,t2))! 
t=tA;nA=nA+l;nl=nl+l 
tA=TS(lambda,g,t) 
if(ni = =1) |tl =t-1/lambdal * log( runif(1)) | 
Ai[nA]=t 
ļ else if( tl = =min(tA ,t1,t2)) | 
t=tl;n1l=n1-1;n2=n2+1 
if(nl = =0)Ítl=Inf| 
else if(n1>0) | 
tl =t-1/lambdal * log(runif(1)) 
l 
if( n2 = =1)t2 =t-1/lambda2 * log(runif( 1) ) 
A2[ nA-nl]=t 
} else if( t2 = =min(tA ,tl ,t2))| 
t=t2 ;nD=nD+l;n2=n2-1 
if(n2==0){ = Inf | 
else if( n2>0) [| t2 =t-1/lambda2 * log( runif(1)) | 
-D[nD] =t;C[nD] =n1+n2 


| 


repeat | 
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if(nl ==0 & n2==0) break 
else if(n1>0 || n2>0) | 
if(tl<t2) | 
t=tl;nl =nl-1;n2=n2+1 
if(n1 = =0) {t1 =Inf} 
else if(n1>0) | 
tl =t-1/lambdal * log( runif(1)) 
| 
if(n2==1){t2=t-l/lambda2 = log( runif(1)) | 
A2[nA-nl] =t 
} else 
t=t2;nD=nD+1;n2=n2-1 
if(n2==0){ t2= nf } 
else if( n2>0) {t2 =t-1/lambda2 * log( runif( 1) ) | 
D[nD]=t;C[nD] =nl+n2 


} 
list( A1 =A1,A2=A2,D=D,barC=mean(C)) 
} 
[89.3] 考虑 有 甲乙 两 台 机 器 的 加 工厂 ,需要 加 工 的 产品 先 在 甲 机 器 
上 加 工 后 ,再 转 到 乙 机 器 上 加 工 , 然 后 出 厂 . 该 加 工厂 每 天 早上 8:00 开始 上 
班 ,晚上 6:00 下 班 .两 台 机 器 分 别 加 工 一 个 产品 的 时 间 服 从 指数 分 布 ,机 器 甲 
平均 每 小 时 加 工 10 个 产品 ,而 机 器 乙 平均 每 小 时 加 工 12 个 产品 . 假设 要 加 工 


的 产品 以 强度 函数 人 ( 世 =6 + 一,: > 0, 非 齐 次 的 Poisson 过 程 来 到 . 试用 模 


t+1’ 
拟 方法 估计 平均 每 件 产品 花费 在 工厂 的 时 间 . 

$ g = function (x) 6 +4/(x+1);T = 10; lambda = 10; lambdal = 10; 
lambda2 = 12 ,运行 queue3 (TS ,T,lambdal ,lambda2) 30 天 得 到 平均 每 件 产品 
花费 在 工厂 的 时 间 为 0.48 小 时 . 

4. 模拟 模型 的 验证 

我 们 希望 用 离散 事件 方法 来 模拟 的 最 终结 果 是 由 无 误 的 计算 机 程序 产生 
的 .为 了 证 实 这 个 程序 中 没有 缺陷 ,我 们 应 该 运用 标准 的 调试 计算 机 程序 的 技 
术 . 有 有 几 个 技术 是 特别 适合 调试 模拟 模型 的 ,现在 我 们 对 之 进行 讨论 . 
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对 于 大 的 程序 ,应 该 设法 对 子 块 或 者 子 程序 来 逐步 调试 . 也 就 是 ,我 们 应 
该 设法 把 这 个 程序 分 割 成 一 些小 的 或 者 是 易于 处 理 的 程序 . 例如 ,在 模拟 模型 
时 ,随机 变量 的 产生 就 构成 一 个 模块 ,对 这 些 模块 应 该 单独 进行 验证 . 

统计 模拟 通常 是 用 大 量 的 输入 变量 写 出 . 通常 选择 一 个 合适 的 值 能 够 简 
化 这 个 模拟 模型 成 为 一 个 能 够 进行 评估 的 或 者 是 已 经 被 广泛 研究 过 的 模型 ， 
以 使 模拟 的 结果 能 和 已 知 的 答案 进行 比较 . 

在 测试 阶段 ,程序 输出 结果 应 该 是 它 产生 的 所 有 随机 量 的 值 . 通过 适当 地 
选择 简单 而 又 特殊 的 情形 ,我 们 能 把 模拟 产生 的 结果 与 手工 得 到 的 答案 相 比 
较 . 例 如 ,假设 我 们 模拟 单个 服务 员 的 排队 系统 . 以 例 9. 1 为 例 来 验证 程序 是 
否 正 确 , 为 了 便于 手工 验算 ,输入 7 = 6, 假设 模拟 程序 产生 了 以 下 数据 : 


顾客 : 1 2 3 4 5 6 7 
到 达 时 间 : 0.14 2.58 2.79 4.37 4.84 5.24 5.86 
服务 时 间 : 0.19 0.88 0.17 0.12 0.47 0.35 0.61 


又 假设 此 程序 根据 这 7 个 顾客 产生 的 输出 为 花费 在 这 个 系统 中 的 平均 时 
间 是 0. 32. 

根据 手工 的 计算 ,我 们 看 到 第 一 个 顾客 在 时 刻 0. 14 来 到 并 花 了 0. 19 个 
时 间 单 位 在 这 个 系统 中 ,第 二 个 顾客 在 时 刻 2. 58 来 到 并 在 时 刻 2. 58 接受 服 
务 ,花费 了 0.88 个 时 间 单 位 ;第 三 个 顾客 在 时 刻 2. 79 来 到 并 在 时 刻 3. 46 接 
受 服务 ( 当 第 二 个 顾客 离开 时 ) ,并 花 了 0.17 个 时 间 单 位 ,因此 第 三 个 顾客 花 
T 0.84 个 时 间 单 位 在 系统 中 ;等 等 . 将 此 计算 表述 如 下 : 


顾客 : 1 2 3 4 5 6 7 

到 达 时 间 : 0.14 2.58 2.79 4.37 4.84 5.24 5.86 
服务 开始 的 时 刻 : 0.14 2.58 3.46 4.37 4.84 5.31 5.86 
离 去 时 刻 : 0.33 3.46 3.63 4.49 5.31 5.66 6.47 


在 系统 中 的 时 间 : 0.19 0.88 0.84 0.12 0.47 0.42 0.61 
因此 根据 7 = 6 之 前 到 达 的 顾客 花 在 系统 中 的 平均 时 间 的 输出 结果 为 


0.19 +0.88 +0.84 +0.12 +0.47 +0.42 +0.61 _ 
= 


因此 这 证 明了 计算 机 程序 输出 的 结果 0.32 是 有 误差 的 . 

在 检索 计算 机 程序 的 错误 时 ,一 个 有 用 的 技术 是 进行 跟踪 . 在 跟踪 中 , 状 
态 变 量 、 事 件 清单 以 及 计数 变量 在 每 个 事件 发 生 后 都 被 打印 出 来 , 据 此 就 可 确 
定 何 时 程序 出 错 . 如 果 跟 踪 时 没有 发 现 错误 出 现 , 我 们 就 再 检查 与 输出 变量 有 
关 的 计算 . 以 下 几 节 模型 都 可 以 采取 类 似 的 方法 进行 验证 。 


0. 50. 
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9.4 存储 模型 


考虑 一 个 备 有 某 种 商品 的 商店 ,其 销售 价格 为 每 单位 r 元 .假设 需求 此 种 
商品 的 顾客 数 服 从 参数 为 A 的 Poisson 分 布 ,每 个 顾客 的 需求 量 是 一 个 分 布 函 
数 为 G 的 随机 变量 . 为 满足 顾客 的 需求 ,店主 必须 储存 一 定量 的 此 种 商品 ,而 
且 不 论 何 时 商品 的 库存 不 足 时 ,那么 此 商品 就 会 从 发 货 商 处 得 到 补充 ,这 个 店 
主 用 所 谓 (s,S) 的 订货 方针 , 即 只 要 商店 的 存货 少 于 *(。 < 5 ) , 且 当 前 没有 
订货 , 则 将 库存 量 补充 到 S. 即 , 如 果 当 前 的 库存 水 平 是 x 而 又 没有 订货 ,有 x 
< s, 那么 就 订购 5S -x 个 单位 的 该 种 商品 . 设 订购 此 种 商品 y 个 单位 的 成 本 函 
数 为 ce(y) , 而 且 需 要 工 个 时 间 单 位 才能 交付 订单 ,其 报酬 依赖 于 订单 的 交付 . 
男 外 ,商店 在 单位 时 间 内 每 库存 一 个 单位 的 商品 需要 花费 个 单位 的 费用 . 进 
一 步 假 定 一 个 顾客 需求 的 商品 量 超 过 了 此 商店 的 现 有 库存 量 ,那么 商店 将 现 
有 的 所 有 的 商品 卖 完 ,其 不 足 部 分 就 造成 了 商店 的 损失 . 

在 某 个 固定 时 间 了 内 ,如何 用 模拟 的 方法 来 估计 商店 的 期 望 利润 ? 为 达 
到 此 目的 ,我们 首先 定义 如 下 的 变量 和 事件 . 

时 间 变 量 t. 

系统 状态 变量 SS (x,y) :x 是 当前 商品 的 库存 量 , y 是 此 商品 订货 量 . 

计数 变量 C :到 时 刻 1 时 订单 花费 的 总 各 . 

H -PJA :i 商品 库存 的 总 花费 . 
R :到 时 刻 上 获得 的 收入 总 量 . 
事件 ”将 由 一 个 顾客 或 者 是 一 个 订单 的 来 到 组 成 .事件 的 时 间 是 
加 :下 一 个 顾客 到 达 的 时 间 . 
:已 签 的 订单 交付 的 时 间 . 如 果 没 有 预 签 的 订单 ,那么 我 们 取 
t, = oo . 

通过 比较 事件 发 生 的 时 间 t。 和 上 的 大 小 来 完成 此 更 新 .用 上 表示 当前 时 
刻 , 并 由 上 述 变量 ,我 们 能 够 进行 如 下 的 更 新 . 

和 情形 1: <t. 

重 置 : H<— H + (ta —t)xh , 因为 在 时 刻 1: 和 之 间 , 对 每 单位 的 存货 ,我 们 
需要 花费 (it。- t)h 的 费用 . 

Bi; t= t. 
产生 一 个 具有 分 布 Ç 的 随机 变量 D, DEE t, 时 刻 来 到 的 顾客 的 需 

求 量 . 

令 w = min(D,x) 为 顾客 能 够 买 到 的 商品 量 . 在 卖 出 v 个 商品 量 后 ， 
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则 存储 量 为 x - w. 
再 令 :R=R + ur. 
再 令 :x=x 一 w. 


如 果 x <s B.y=0, WHS y=S - xt, = t + L. 


产生 U, 并 令吉 =t -= —log( U). 


再 令 : HH + (t, —- t)xh. 
再 令 :t =t,. 
再 令 :C — C +c(y). 
Jg2Z=Ú; x — x + y. 
再 令 :7Y=0 =. 
通过 运用 上 述 更 新 时 刻 表 ,我 们 容易 写 一 个 模拟 程序 来 分 析 此 模型 .然后 
运行 这 个 程序 直到 在 某 个 预先 指定 的 时 间 了 之 后 第 一 个 事件 发 生 为 止 ,我们 
再 用 二 6 一 挟 作 为 这 个 商店 的 每 单位 时 间 的 平均 利润 的 估计 量 . 改变 s 和 5 
的 值 再 重复 上 述 程序 ,将 能 使 我 们 为 此 商店 确定 一 个 合适 的 库存 量 . 存 贮 问题 
的 R 程序 为 
inventory =function(x,T,lambda,s,S,h,r,L,d,lose,a,b) | 
###x 为 当前 的 存货 ,T 为 时 间 周 期 ,lambda 为 顾客 来 到 速率 
###(s,S) 为 库存 策略 
###h 为 单位 时 间 单 位 商品 的 库存 费 
Hr 为 商品 的 零售 价 
###L 为 订货 的 周期 
###d 为 订货 费用 函数 (包括 运输 费用 ) 
###]ose 为 损失 函数 
###a 为 需求 量 ,b 为 对 应 的 分 布 律 
t=0;U =runif( 1) ; t0 =-1/lambda * log(U) 
tl =Inf;H=0;C=0;R=0;y=0 
loss=0;k=1 
while(t0[k]<=T) | 
k=k+1 
if(tO[k-1]<t1[k-1])] 
H=H+(t0[k-1]-t) *h(x);t=t0[k-1] 
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D=sample(a,1,prob=b) 
w=min(D,x) 
if( D>x) Í loss[k-1] =lose(D,x) | 
else{ loss[k-1]=0 } 
R=R+w *r;x=x-w 
if(x<s & y==0)| 
y=S-x;tl[k]=t+L 
| 
U=runif(1);t0[k] =t-1/lambda * log( U) ilose[k] =0 
} else | 
H=H+(t1[k-1]-t) *x*h;t=tl[k-1] 
C=C+d(y);x=x+y 
y=0;tl [k] =Inf;loss[k]=0 
l 
} 
(R-H-C-sum( loss) ) ZT 
| 
[819.4] 设 某 商 店 经 销 某 种 商品 ,每 天 来 此 商店 购买 此 种 商品 的 顾客 
按照 速率 为 8 的 Poisson 过 程 来 到 ,而 且 据 历史 经 验 得 到 顾客 的 购买 量 上 的 分 
布 律 如 表 9-5 所 示 . 
此 种 商品 单价 为 5 元 ,每 
表 9-5 ”购买 量 & 的 分 布 律 天 库存 此 种 商品 一 单位 的 费用 
£ 1 2 3 4 为 0.5 元 ,运费 为 10 元 ,而 卖 
p 07 02 00 0.0 出 此 种 商品 一 个 单位 的 价格 为 
12 元 . 若 商 店 的 库存 量 小 于 顾 
客 的 需求 量 ,也 会 带 来 损失 
(该 赚 的 而 没有 赚 到 看 做 一 种 损失 ) , 设 损失 函数 lose(D,x)=(D -x) .2,x < 
D. 如果 店主 的 存 贮 策略 为 (s,S)= (10,120). 问 在 一 个 月 内 ,此 商店 是 否 盈 
利 ? 利润 是 多 少 ? 
根据 题 意 , lambda =8, 了 =30,r=12, 成 本 函数 d(x) = 10 + 0.5x, 库存 
KÆ h(x) = 0.5x. 运行 inventory(x,T,lambda,s,S,h,r,L,d,lose,a,p) 得 到 平 
均 每 天 利润 为 68. 84 元 . 若 要 得 到 最 佳 策略 ,可 通过 不 断 调整 (*,$) 的 值 进行 
寻找 . 如 何 寻 找 最 佳 策略 (s,S) 留 作 练 习 . 
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9.5 保险 风险 模型 


假设 某 意外 保险 公司 需要 索赔 的 客户 数 是 速率 为 A 的 Poisson 过 程 , 且 每 
个 客户 的 索赔 人 额 是 具有 分 布 的 随机 变量 . 假设 新 客户 以 速率 v 的 Poisson 过 
程 来 签订 合同 , 且 原 来 的 客户 继续 与 公司 保持 合同 的 时 间 是 一 个 速率 的 指 
数 随机 变量 . 再 假设 每 个 客户 固定 地 在 每 单位 时 间 付 给 保险 公司 c 个 单位 的 
费用 . 保险 公司 开始 有 no 个 客户 ,有 本 人 金 a。> 0, 我 们 的 目的 是 用 模拟 来 估计 
直到 时 刻 7 为止 保险 公司 的 资金 总 是 非 负 的 概率 . 

为 了 便于 进行 模拟 ,定义 如 下 变量 和 事件 : 

时 间 变 量 上 

系统 状态 变量 (n,a) : n 为 此 公司 的 客户 数 , a 为 此 公司 的 当前 资金 . 

事件 ”有 3 种 类 型 的 事件 ,新 增 一 个 客户 ,失去 一 个 客户 以 及 一 个 索赔 . 

事件 清单 仅 有 -一个 值 , 即 下 一 个 事件 发 生 的 时 间 . 

EL tg- 

首先 注意 下 述 事实 : 

车 随机 变量 X， ~ E(A) ,i=1,2,…,n, Y ~ E(u), BEHE, N 


À 
nÀ +p 


根据 上 述 事 实 ,我 们 能 得 到 下 一 个 事件 发 生 的 时 间 所 构成 的 事件 清单 . 如 
果 (n,a) 是 在 时 刻 上 时 的 系统 状态 ,那么 下 一 个 事件 发 生 的 时 间 将 等 于 :+ 工 ， 
这 里 是 一 个 具有 速率 v + nu + nÀ 的 指数 随机 变量 . 下 一 个 事件 的 发 生 , 以 


概率 一 一 新 增 一 个 新 的 客户 ,或 者 以 概率 一 一 此 一 失去 一 个 客 


u + np. + nÀ u + np + nÀ 


户 ,或 者 以 概率 C TY 进行 一 个 索赔 


设 索 赔 额 了 是 具有 分 布下 的 随机 变量 . 又 设 J = 1 表示 新 增 一 个 新 的 客 
户 , 设 J= 2 表示 失去 一 个 客户 , 设 J = 3 表示 一 个 索赔 . 其 分 布 律 如 表 9-6. 


min(X,,X,,--- XY) ~ E(na +u), B P|X, = min(X,Y)} = 





表 9-6 事件 类 型 的 分 布 
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输出 变量 7 
r=” 如 果 公司 的 当前 资金 在 区 间 [0, 纪 上 非 负 ， 
0, 否则 . 
下 面 给 出 模拟 算法 : 


Step 1 :初始化 , 令 1=0,a=ao,n=n,,1=0, 然后 产生 半 并 令 1, = X. 

Step 2: 如 果 1。> T, @ I = 1 并 中 止 , 转 到 Step 7. 

Step 3: 否 则 ,再 令 o — a +nc(ts = t), B t = t. 产生 一 个 了 

Step 4: 如 果 J= 1, Z n — n + 1, >Æ X, #9 t, = t + X, 返回 Step 2. 

Step 5:n R J =2, nen- 1, Æ X, 再 令 t。 = t + X, 返回 Step 2. 

Step 6: 如 果 J=3, 产生 Y. EY > a, 令 7=0 并 中 止 , 转 到 Step 7; 否 则 令 
a =a - Y, >#E X, 再 令 te = t + X, 返回 Step 2. 


Step 7: 记 录 t 的 值 并 计算 min( 28.1) . 
其 R 程序 为 


insuran =function(T ,nu,mu,lambda,n0 ,a0,c,lambdal ) | 
k=1;J=0;t=0;n=n0;a=a0+n * c;tE=rexp(l,nu+n * mu+n * 
lambda) 
repeat {k=k+1 
if(tE[k-1]>T) break 
else Í 
t=tE[k-1] 
q=nu+n * mu+n * lambda 
p=c(nu/q,n * mu/q,l-nu/q-n * mu/q) 
J[k-1 ] =sample(1:3,1,prob=p) 
if(J[k-1]==1)ln=n+l;a[k]=a[k-1]+c] 
else if(J[k-1] ==2){n=n-1;a[k]=a[k-1]-c + 
(T-t)/T} | 
else if(J[k-1]==3)] 
Y =rexp(1 ,lambdal ) 
if( Y>a[ k-1 ] ) break 
else |a[k]=a[k-1]-Y| 
| 
tE[k] =t-1/(nu+n * mu+n * lambda) * log( runif( 1) ) 
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} 

list( rewp = min( tE[ k-1 ]/T,1),a=a[k-1],tE=tE,J=table(J)) 

#list( rewp=min(tE[k-1]/T,1),a=a[k-1]) 

} 

【 例 9.5】 设 保险 公司 拥有 启动 资金 2.5 万 元 ,已 有 客户 100 人 ,每 人 预 

交 1200 元 , 按 一 年 时 间 进 行 投保 . 如 果 出 现 意 外 事故 ,保险 公司 按 均值 为 2 万 
元 的 指数 分 布 付 给 客户 保险 费 .每 个 客户 在 一 年 内 以 速率 0.5 人 次 退 保 ,公司 
按 投保 时 间 的 比例 退 给 此 客户 预 交 金 . 而 在 一 年 内 以 速率 50 人 次 新 增 一 位 客 
户 . 试用 模拟 估计 保险 公司 破产 率 以 及 年 终 的 盈利 . 


根据 题 意 知 , T = 365, nu =3, mu =- 全， lambda = 5, n, = 100, a, = 





25000, c = 1200, lambdal = 运行 insuran( T, nu ,mu,lambda,n0,a0,c, 


1 
20000` 
lambdal ) 100 次 得 到 保险 公司 破产 率 为 0.05, £F 2Z£ BJ 88 R 29 83825.46 — 
25000 = 58825. 46 元 . 


9.6 维修 问题 


一 个 系统 需要 n 台 机 器 同时 工作 才能 运行 . 为 防 机 器 出 故障 ,有 备用 的 机 
器 * 台 . 只 要 有 一 台 机 器 出 故障, 立即 用 一 台 备 用 机 器 替换 ,并 将 故障 机 器 送 
维修 车 间 进 行 修 理 ,而 维修 车 间 只 有 一 个 修理 工 , 且 每 次 只 能 修一 台 机 器 . 一 
县 出 故障 的 机 器 被 修好 后 就 成 为 备用 的 机 器 . 每 台 机 器 的 修理 时 间 是 相互 独 
立 的 且 具 有 共同 分 布 G 的 随机 变量 . 当 一 台 机 器 投入 使 用 时 ,那么 它 在 出 故 
障 之 前 的 运转 时 间 和 过 去 的 运转 时 间 以 及 修理 时 间 独 立 并 服从 分 布 玉 的 随 
机 变量 . 

当 一 台 机 器 损坏 而 没有 备用 的 机 器 可 用 时 , 则 称 这 个 系统 “瘫痪 ”我 们 
感 兴趣 的 是 模拟 这 个 系统 运转 时 间 T. 

时 间 变 量 t. 

系统 状态 变量 r :在 时 刻 上 出 故障 的 机 器 数 . 

因为 当 一 台 正 在 工作 的 机 器 出 故障 或 者 当 一 台 机 器 维修 完成 时 ,这 个 系 
统 变量 将 发 生变 化 ,所 以 只 要 一 台 正 在 工作 的 机 器 出 故障 或 者 一 台 机 器 维修 
完成 ,我 们 就 说 一 个 “事件 ”发 生 . 为 了 知道 下 一 事件 何 时 发 生 ,我 们 需要 跟 肾 
目前 正在 使 用 的 机 器 出 现 故 障 的 时 间 和 目前 正在 修理 的 机 器 被 修好 的 时 间 
( 若 有 机 器 在 修理 ). 因为 我 们 总 是 需要 确定 这 n 台 机 器 出 故障 时 间 的 最 小 
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值 ,所 以 将 n 台 机 器 出 故障 的 时 间 按 次 序 进行 排列 是 方便 的 ,从 而 令 事件 的 清 
单 如 下 : 
事件 清单 :i < t S< t, < Ssh, t, 
其 中 ,4 ,ts,… ,ts 是 目前 在 使 用 中 的 n 台 机 响 损 坏 的 时 间 , 1” 是 目前 在 维修 
的 机 器 被 修好 的 时 间 , 如 果 目 前 没有 机 器 要 维修 ,就 令 :” = %. 
为 了 模拟 此 过 程 ,我 们 把 这 些 变量 进行 初始 化 : 
@t=r=0, t ==. 
产生 相互 独立 的 具有 分 布下 的 随机 变量 X,X,X 
将 这 些 值 进行 排序 并 令 t 是 第 i 个 最 小 值 , i = 1,2,…,n. 
令 事 件 清单 : t statt ,it t. 
按照 下 述 两 种 情形 更 新 这 个 系统 . 
情形 1: 1 < t°. 
再 令 : 上 = 三. 
再 令 :rr + 1( 因 为 另外 一 台 机 器 已 经 出 现 故 障 ). 
车 r=s+1, 停止 运行 并 收集 数据 了 7 =: (因为 目前 有 s+ 1 台 机 器 出 
现 故 障 ,没有 备用 机 器 可 用 ). 
# r <s+1, 产生 具有 分 布下 的 随机 变量 X, 这 个 随机 变量 表示 现在 
开始 投入 使 用 的 备用 机 器 的 工作 时 间 . 再 将 t,t ,… ,t,t + 的 值 排序 ,并 令 
t 为 这 些 值 中 的 第 i 个 最 小 值 , i = 1 ,2,…,n. 
车 r=1, 产生 具有 分 布 Ç 的 随机 变量 了 , 并 令 1* =!+ 了 (这 是 必要 的 , 因 
为 在 这 种 情形 下 刚 出 故障 的 机 器 是 此 时 唯一 出 故障 的 机 器 ,并 立即 对 此 机 器 
进行 维修 ;了 是 它 的 维修 时 间 ,因此 它 在 上 + 工时 被 修好 )， 
情形 2: t < h. 
再 令 : t= t°. 
FZ: r<—r - 1. 
Er > 0, 产 生 具 有 分 布 6 的 随机 变量 了 一 一 表示 机 器 的 修理 时 间 ， 
青 令 1”=++Y. 
车 r=0, St =o.. 
每 当 停 止 (在 r=s +1 时 事件 发 生 ) 时 ,我 们 就 说 一 个 过 程 被 完成 . 这 个 过 
程 的 输出 结果 是 这 个 系统 瘫痪 时 刻 T 的 值 . 然后 重新 初始 化 并 模拟 另 一 个 过 
程 . 总 之 ,我 们 进行 次 这 样 的 过 程 得 到 输出 的 结果 为 T, ,7,,… ,7,. 因为 这 上 
个 随机 变量 是 相互 独立 的 ,每 次 代表 了 此 系统 的 出 现 瘫 痰 时 间 , 其 平均 值 


Y TE ELT) 的 估计 值 , E[ T] 表示 系统 的 平均 竣 疾 前 运转 时 间 . 
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实施 上 述 算法 的 R 程序 为 
repair = function ( n,s,lambdal ,lambda2 ) | 
t=r=k=0;trep= Inf 
tin = rexp( n ,lambda1 ) 
tin = sort( tin ) 
repeat] k=k+1 
if( tin[ 1] = =Inf) break 
else if(tin [1 ]<trep[k])! 
t=tin[1];r[k]=r[k]+1;r[k+1]=r[k] 
x=rexp(l,lambdal);tin[1]=t+x 
tin = sort( tin) : 
if(r[k]==1){ 
y=rexp(1,lambda2) ;trep[k] =t+y 
trep[ k+1] =trep[ k] 
l 
else if(r[k]>l & r[k]<=s)Ítrep[k+1]=trep[k]| 
else if(r[k]>=s+1) break 
| else| 
t=trep;r[k]=r[k]-1 
y=rexp( 1 ,lambda2 ) ; trep[ k] =t+y 
if(r[k]= =0) ftrep[k+l]=Infl 
else if(r[k]>0) | trep[k+1] =trep[ k]! 


} 
list( T=t,tin=tin,trep=trep,r=r) 
l 
【 例 9.6】 有 一 个 系统 ,需要 15 个 部 件 同时 工作 才能 运行 ,而 且 准 备 了 5 
个 备用 部 件 ,每 个 部 件 的 工作 寿命 都 服从 均值 为 0.01 小 时 的 指数 分 布 . 若 部 
件 损坏 立即 送 往 维修 点 修理 ,修理 时 间 服 从 均值 为 0.1 小 时 的 指数 分 布 ,部 件 
修好 后 和 新 部 件 具 有 同样 的 作用 并 立即 送 往 系统 进行 备用 . 如 果 系 统 中 所 有 
的 部 件 损坏 而 又 没有 备用 部 件 时 , 则 系统 瘫痪 . 请 模拟 出 系统 在 瘫 疾 前 的 运转 
时 间 T. 
据 题 意 知 , A, = 0.01, A, =0.1,n=15,s=5, 运行 repair(n,s,lambdal， 
lambda2 ) 10000 次 得 到 平均 系统 闪 痪 前 运转 时 间 为 118. 98 小 时 . 
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9.7 期 权 实施 策略 


设 5,,n 之 0, 为 某 种 股票 在 第 n 天 的 收盘 价格 , 设 氏 , ,X,… X. 是 相互 独 
立 的 具有 均值 和 方差 的 正 态 随 机 变量 , XX, 表示 第 i 天 相对 于 第 i- 1 天 的 
增长 率 .一 个 常用 的 模型 是 
S, = Soexp{X, +X, + .… +X.) , n > 0. 
此 模型 称 为 对 数 正 态 随机 游 动 模型 . 通过 计算 可 得 第 ”天 的 收盘 价格 S. 的 期 
望 值 


ELS,] = Sa [JELE] = se", 


Epas PET, MUAMER TR N RKR K OREM E 


此 股票 一 单位 的 优先 权 ,如 果 能 够 立刻 转手 以 价格 S 卖 出 此 股票 ,那么 我 们 称 
S- KRANA. 在 拥有 期 权时 间 内 ,如 果 股 票 价格 高 于 殴 定 价 K, 就 实施 期 权 ; 
否则 ,不 实施 期 权 ,我 们 称 此 规则 为 期 权 实施 的 策略 . 从 而 知 ,拥有 期 权 所 获得 
的 期 望 利润 依赖 于 对 期 权 实施 的 策略 . 能 够 证 明 ,如 果 a > 0, 则 最 优 策 略 是 
直到 股票 价格 超过 天 时 就 实施 期 权 ,否则 不 实施 . 因为 X， + X, +e + X, 是 一 
个 均值 Nu 和 方差 No? 的 正 态 随 机 变量 ,所 以 很 容易 确切 地 计算 出 按照 这 个 
策略 得 到 的 回报 .然而 , 当 a < 0 时 ,很 难 找到 最 优 的 或 者 一 个 接近 最 优 的 策 
略 ,而 且 对 任何 一 个 合理 的 策略 都 不 可 能 确切 地 计算 所 期 望 的 盈利 .我 们 现在 
给 出 一 个 当 a < 0 时 能 够 实施 的 策略 . 尽管 这 个 策略 离 最 优 策略 还 很 遥远 ,但 
它 是 合理 的 . 此 策略 是 :假设 离 期 权 到 期 还 有 m 天 ,车 此 后 第 i,i = 1,2,…,m， 
天 的 价格 大 于 等 于 天 , 就 实施 此 期 权 ,否则 放弃 实施 此 期 权 . 

令 P。=Sw-。 表 示 在 期 权 还 有 普天 到 期 时 的 股票 价格 . 那么 我 们 建议 的 策 
隆 如 下 : 

如 果 离 期 权 到 期 还 有 m RMH Pa > 下 时, 且 对 于 每 个 i=1,2,…,m, 有 

P, > K + P, e“@(oji + b,) - K@(b,) , 
iu 一 log $ 

Ht b, -一 P(x) 是 标准 正 态 分 布 函数 , 则 在 这 个 时 期 实施 期 权 . 


如 果 期 权 实施 了 ,就 令 SP 表示 期 要 执行 时 股票 的 价格 ;如 果 期 权 没 有 实 
施 ,就 令 SP = K. 为 了 得 到 上 述 策略 的 期 望 值 ,也 就 是 为 了 确定 E[SP] - K, 在 
理论 上 很 难处 理 ,必须 采取 模拟 的 方法 . 对 于 给 定 的 参数 用 ,co ,N,K,So, 策略 
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的 模拟 步骤 为 
Step 1 :产生 N - m PRAHE p 和 标准 差 o 的 正 态 随机 变量 XX, ,X,,…， 
Xyon» P P, = Spon = Se" 
Step 2: 产 生 一 个 具有 均值 x 和 标准 差 e 的 正 态 随机 变量 工 , H Pai = 
P, e" 来 产生 N - m 后 每 天 的 股票 价格 P... P. o. Pi 
Step 3: 车 已 > K, 且 对 于 每 个 1i= 1,2,…,m ,有 已 > K +P, e“ (oj + 
b,) - KB(b,), 则 在 离 到 期 日 m 天 实施 此 期 权 , 令 SP = P, 并 记录 之 . 
Step 4 :如果 m 不 满足 Step 3 , 则 对 m - 1 重复 Step 3. 
Step 5: 如 果 没 有 m 满足 Step 3 , 则 令 SP = 天 并 记录 之 . 
其 R 程序 为 : 
##lHHriHtttth #t 价 HHHHdHHdHHHH 
EndPric = function( x,P) | al=mutsigma’/2 
K+P * exp(x * al) * pnorm ( sigma * sqrt( x) +(x * mu-log( K/ 
P))Z(sigma * sqrt( x) ) ) 
-K * pnorm( (x * mu-log( K/P) ) / ( sigma * sqrt( x) ) ) 
| 
#HiHtilHittttpsS- E ERA E F AHAHHH 
stock = function( SO,K,N,mu, sigma) | 
P=S0;m=N 
repeat| i=1:m 
if(P>K & all(P-EndPric(i,P) >0) )break 
X=rnorm(1,mu,sigma) ;P=P * exp( X) 
m=m-1 


if(m<=0) break 


{if(m<=0)SP=K else SP=P} 
Hst(SP=SP,m=m) 
I 
stock( S0,K,N,mu,sigma) 
【 例 9.7] 如 果 目 前 的 股票 价格 是 150 元 ,此 期 权 可 以 在 接 下 来 的 30 天 
内 任何 时 候 以 价格 为 150 元 购买 此 股票 . 假设 在 本 节 的 模型 中 ,上 =- 0.09, 


o = 0.4, 并 应 用 本 节 所 提出 的 策略 来 实施 期 权 . 试 根据 模拟 来 估计 拥有 一 个 
期 权 的 平均 值 . 
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EHEM, S, =150, K=150, N=30,4=~-0.09,0 =0.4, 运行 stock ( SO , 
K,N ,mu,sigma)1000 次 得 到 此 期 权 的 平均 值 为 235. 5246 元 . 


练 习 9 


1. 一 只 兔子 在 0 点 处 , 它 的 洞穴 在 正 北 20 米 的 8 处 ,一 只 狼 位 于 兔子 的 
IEX 33 米 的 4 处 .模拟 如 下 追逐 问题 : 狼 以 一 倍 于 兔子 的 速度 紧 盯 着 兔子 追 
击 。 画 出 狼 追 逐 兔 子 的 追逐 曲线 . 问 : 当 兔子 到 达 洞 口 前 是 否 被 狼 还 住 ? 

2. 某 维修 中 心 在 周末 只 安排 一 名 员工 为 顾客 提供 服务 . 新 来 维修 的 顾客 
到 达 后 , 若 已 有 顾客 正在 接受 服务 , 则 需要 排队 等 候 . 假设 来 维修 的 顾客 到 达 
过 程 为 Poisson 过 程 ,平均 4 人 /小 时 ,维修 时 间 服 从 指数 分 布 ,平均 需要 6 分 
钟 . 试用 模拟 的 方法 求 该 系统 的 平均 队长 ,以 及 每 位 顾客 花费 在 系统 中 的 平均 
时 间 和 员工 平均 加 班 时 间 . 

3. 一 个 服务 员 的 售 货 亭 ,顾客 的 平均 到 达 时 间 ( 单 位 为 ; 秒 ) 服 从 正 态 分 
布 W(20 ,10 ) , 顾客 购买 商品 量 的 分 布 律 为 

Xx 1 2 3 4 
P |0.5 02 02 0.1 


购买 每 件 商品 需要 的 时 间 ( 单 位 为 : 秒 ) 服 从 正 态 分 布 W(15,5?). 若 售 货 亭 无 
顾客 , 则 新 到 的 顾客 接受 服务 ,否则 排队 等 候 . 试 模拟 售 货 亭 运营 12 小 时 后 ， 
售 货 亭 的 平均 队长 .顾客 的 平均 花费 时 间 及 售货员 的 平均 加 班 时 间 . 

4. 在 单 服务 员 的 排队 模型 中 ,来 到 过 程 是 一 个 具有 速率 10 的 Poisson 过 
E ,服务 时 间 服 从 区 间 (0.5,1.5) 上 的 均匀 分 布 ,时 间 周 期 为 了 = 9. 试 估计 一 
个 顾客 花费 在 系统 中 的 平均 时 间 平均 队长 以 及 服务 员 平 均 加 班 时 间 . 

5. 设 打印 室 有 2 名 打字 员 ,每 个 文件 打印 的 时 间 服 从 指数 分 布 ,打字 员 1 
和 打字 员 2 打印 一 份 文件 的 平均 时 间 分 别 为 10 分 钟 和 12 分 钟 , 而 文件 的 到 
达 是 以 速率 为 15 件 / 小 时 的 Poisson 过 程 . 试用 模拟 的 方法 求 出 打印 室 打印 一 
份 文件 的 平均 时 间 及 各 打字 员 平均 每 小 时 打印 的 文件 数 . 

6. 在 有 2 个 服务 员 的 排队 模型 中 ,假设 每 个 服务 员 前 有 其 自己 的 排队 ,一 
个 来 到 者 加 入 到 最 短 的 队伍 中 . 当 来 到 者 发 现 两 个 队伍 一 样 长 (或 者 发 现 两 
个 服务 员 前 都 是 空 ) 时 就 来 到 服务 员 1 前 . 

(1) 确 定 适当 的 变量 和 事件 来 分 析 这 个 模型 ,并 给 出 更 新 过 程 . 

(2) 假 设 服 务 员 1 的 分 布 是 速率 为 4 的 指数 分 布 ,服务 员 2 的 分 布 是 速率 
为 3 的 指数 分 布 , 并 且 顾 客 以 速率 为 6 的 Poisson 过 程 来 到 . 
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试 求 1000 个 顾客 花费 在 系统 中 的 平均 时 间 及 这 1000 个 来 到 者 中 由 服务 
员 1 服务 所 占 的 比例 . 
7. 假设 某 地 区 某 品牌 的 代理 商 销售 该 品牌 的 产品 ,购买 此 产品 的 顾客 按 
照 速 率 为 50 人 /天 的 Poisson 过 程 来 到 该 代理 处 ,而 且 据 以 往 的 经 验 ,顾客 的 
购买 量子 的 分 布 律 如 下 : 
X 1 2 3 4 
P 06 02 01 0.1 


此 代理 商 从 厂家 进货 的 单价 为 500 元 ,每 天 库存 此 种 商品 一 单位 的 费用 为 0.5 
元 ,每 次 从 厂家 进货 的 运费 为 100 元 ,而 卖 出 此 种 商品 单价 为 950 元 . 若 代理 
商 的 库存 量 小 于 顾客 的 需求 量 ,也 会 带 来 损失 (该 赚 的 而 没有 赚 到 视 为 一 种 
损失 ) , 设 损失 函数 

lose(D,x)= (D - x) :50,x < D. 
如 果 该 代理 商 的 存 贮 策略 为 (s,S) = (10,100). 

试 求 :(1) 在 一 个 月 内 ,此 代理 商 平均 的 利润 是 多 少 ? 

(2) 如 何 改 变 策略 (s ,5) 使 得 利润 达到 最 大 ? 

8. 假设 一 个 保险 公司 每 天 的 索赔 客户 数 服从 速率 为 10 起 /天 的 Poisson 
过 程 . 每 个 客户 的 索赔 额 是 一 个 均值 为 1000 元 的 指数 随机 变量 . 假设 该 公司 
以 固定 速率 11000 元 /天 收 到 付款 且 启 动 资 金 为 2500 元 . 试用 模拟 来 估计 该 
公司 的 资金 在 前 365 天 中 始终 为 正 的 概率 . 

9. 假设 一 个 系统 由 4 台 机 器 组 成 ,其 中 备用 机 器 为 3 台 , 每 台 机 器 的 寿命 
分 布 函数 为 f 

F(x)= 1 - e”. 
若 机 器 损坏 立即 送 修理 厂 维修 ,每 台 机 器 维修 时 间 的 分 布 函数 为 C(z) = 1 - 
e -2 请 模拟 估计 此 系统 次 痪 的 平均 时 间 . 

10. 在 维修 模型 中 ,假设 修理 车 间 有 2 个 修理 工 ,每 个 工人 修理 机 器 的 时 
间 是 具有 分 布 G 的 随机 变量 .为 此 系统 画 一 个 流程 图 . 

11. 如 果 当 前 某 股票 的 收盘 价 为 36. 31 元 , 现 有 一 个 期 权 可 以 在 接 下 来 的 
30 天 内 任何 时 候 以 价格 为 36.31 元 购买 此 股票 . 假设 此 股票 价格 模型 为 对 数 
正 态 随机 游 动 模型 ,其 相对 于 前 一 天 的 增长 率 服从 正 态 分 布 N(- 0.05, 
0.16), 并 应 用 9.7 节 所 提出 的 策略 来 实施 期 权 . 试 根据 模拟 来 估计 拥有 此 期 
权 的 平均 价值 . l 
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